大数据与机器学习-最新-第36页-阿里云开发者社区

阿里云大数据

|

8月前

|

分布式计算运维搜索推荐

|

博文

立马耀：通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统，驱动个性化推荐业务

蝉妈妈旗下蝉选通过迁移到阿里云 Serverless Spark 及 Milvus，解决传统架构性能瓶颈与运维复杂性问题。新方案实现离线任务耗时减少40%、失败率降80%，Milvus 向量检索成本降低75%，支持更大规模数据处理，查询响应提速。

455 57 57

来自：开源大数据平台 E-MapReduce 版块

阿里云大数据Al技术

|

8月前

|

人工智能运维 API

|

博文

PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit

4月27日，阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit，性能达到开源 SOTA。Step1X-Edit模型总参数量为19B，实现 MLLM 与 DiT 的深度融合，在编辑精度与图像保真度上实现大幅提升，具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力；支持文字替换、风格迁移等11 类高频图像编辑任务类型。在最新发布的图像编辑基准 GEdit-Bench 中，Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型，比肩 GPT-4o 与 Gemin。PAI-ModelGallery 支持Step1X-Edit一键部署方案。

279 2 2

来自：人工智能平台PAI 版块

阿里云大数据

|

8月前

|

SQL 分布式计算 Serverless

|

博文

鹰角网络：EMR Serverless Spark 在《明日方舟》游戏业务的应用

鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求，采用阿里云 EMR Serverless Spark 替代原有架构。迁移后实现研发效率提升，支持业务快速发展、计算效率提升，增强SLA保障，稳定性提升，降低运维成本，并支撑全球化数据架构部署。

885 56 57

来自：开源大数据平台 E-MapReduce 版块

灵杰开发者

|

8月前

|

存储 SQL 运维

|

博文

中国联通网络资源湖仓一体应用实践

本文分享了中国联通技术专家李晓昱在Flink Forward Asia 2024上的演讲，介绍如何借助Flink+Paimon湖仓一体架构解决传统数仓处理百亿级数据的瓶颈。内容涵盖网络资源中心概况、现有挑战、新架构设计及实施效果。新方案实现了数据一致性100%，同步延迟从3小时降至3分钟，存储成本降低50%，为通信行业提供了高效的数据管理范例。未来将深化流式数仓与智能运维融合，推动数字化升级。

395 0 0

来自：实时计算 Flink 版块

50019993

|

8月前

|

问答

钉钉考勤机8点前，1个人在2台考勤机上分别打卡，但只推送1次打卡记录。接口也只能调到一次记录，如何改

132 0 0

来自：智能搜索推荐版块

竹相_左小空空

|

8月前

|

开发工具 C++ git

|

博文

五分钟看懂推送本地项目到 GitHub新手菜鸡

1048 0 0

邂逅惊鸿

|

8月前

|

供应链测试技术

|

博文

产品工作流程 - AxureMost

本文介绍了产品工作流程中的IPD（集成产品开发）流程，强调产品经理对整个产品过程的管控。IPD流程包含六个主要阶段：概念、计划、开发、验证、发布和生命周期管理，每个阶段都有明确目标、活动及决策评审点（DRP），以确保项目按目标推进并适应市场变化，提升产品开发成功率与市场响应速度。

807 0 0

Deephub

|

8月前

|

机器学习/深度学习人工智能算法

|

博文

零训练成本优化LLM： 11种LLM权重合并策略原理与MergeKit实战配置

随着大语言模型快速发展，如何优化性能同时降低计算成本成为关键问题。本文系统介绍了11种零训练成本的LLM权重合并策略，涵盖线性权重平均（Model Soup）、球面插值（SLERP）、任务算术、TIES-Merging等方法，通过MergeKit工具提供实战配置示例。无论研究者还是开发者，都能从中找到高效优化方案，在有限资源下实现模型性能显著提升。

404 10 10

王浩宇宙-46776

|

8月前

|

问答

使用标注好的csv文件进行文本识别训练时，老是报错：标签列没有正确加载为ClassLabel类型

56 0 0

winx_19970108018

|

8月前

|

搜索推荐 API 开发者

|

博文

京东商品列表 API 接口全解析：从入门到精通

京东商品列表API是京东开放平台为开发者提供的核心数据接口，支持批量获取商品基础信息、价格、库存状态等多维度数据。它具备数据丰富性、灵活筛选与分页查询、稳定高效等特点，可满足市场分析、选品优化、比价工具及推荐系统开发等需求，为电商业务创新提供坚实支撑。通过标准化通道，助力第三方高效、合法地利用京东海量商品数据。

326 3 3

winx_19970108018

|

8月前

|

XML JSON API

|

博文

手把手教你调用京东商品详情 API：从申请到数据抓取全流程

京东商品详情API为电商从业者、分析师及开发者提供高效数据支持，助力优化业务与研究。该接口具备丰富数据（商品属性、价格、描述、图片、评价等）与灵活请求方式（GET/POST），满足多样化需求，是数字化时代电商应用开发与分析的有力工具。

523 13 13

Echo_Wish

|

8月前

|

边缘计算运维监控

|

博文

5G落地没那么简单！细扒部署挑战与硬核解决方案

271 30 30

Echo_Wish

|

8月前

|

数据采集算法数据挖掘

|

博文

别再野蛮操作了！用Python优雅地搞定数据清洗

393 33 34

蒋点数分

|

8月前

|

SQL 机器学习/深度学习前端开发

|

博文

【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位？

这是一道我改编的 SQL 题目，不仅需要你输出连续的空座，还需要你去计算观影的最优位置。经过改编后，我相信是蛮有趣味的一道题。

218 24 25

阿里云大数据Al技术

|

8月前

|

开发者

|

博文

云上玩转DeepSeek系列之六：DeepSeek云端加速版发布，具备超高推理性能

作为国内首个千亿级开源 MoE 模型，DeepSeek-R1 凭借其卓越的代码生成与复杂推理能力，已成为开发者构建智能应用的首选。然而，原始模型在产业落地中面临严峻挑战，部署 671B 满血版模型不仅硬件门槛要求很高，同时吞吐效率和响应延迟也受到了制约。PAI 正式推出了优化版 DeepSeek-R1 模型 DeepSeek-R1-PAI-optimized，将大模型推理效率推向了 Next Level。

370 11 11

来自：人工智能平台PAI 版块

灵杰开发者

|

8月前

|

存储人工智能搜索推荐

|

博文

如何用大模型+RAG 给宠物做一个 AI 健康助手？——阿里云 AI 搜索开放平台

本文分享了如何利用阿里云 AI 搜索开放平台，基于 LLM+RAG 的系统框架，构建“宠物医院AI助手”的实践过程。

790 14 15

来自：智能搜索推荐版块

小攻云攻略

|

8月前

|

人工智能大数据

|

博文

阿里云产品四月刊来啦

阿里云百炼推出首个全生命周期MCP服务，通义万相2.1首尾帧模型开源，大数据 AI 产品升级发布，详情请点击阿里云产品四月刊

208 12 12

阿里云大数据

|

8月前

|

存储运维 Serverless

|

博文

千万级数据秒级响应！碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构，解决了海量数据处理中的资源利用率低、并发能力不足等问题，显著降低了硬件和运维成本。实时查询性能提升8倍，查询出错率减少30倍，集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验，还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。

774 69 69

来自：开源大数据平台 E-MapReduce 版块

Deephub

|

8月前

|

机器学习/深度学习存储算法

|

博文

NoProp：无需反向传播，基于去噪原理的非全局梯度传播神经网络训练，可大幅降低内存消耗

反向传播算法虽是深度学习基石，但面临内存消耗大和并行扩展受限的问题。近期，牛津大学等机构提出NoProp方法，通过扩散模型概念，将训练重塑为分层去噪任务，无需全局前向或反向传播。NoProp包含三种变体（DT、CT、FM），具备低内存占用与高效训练优势，在CIFAR-10等数据集上达到与传统方法相当的性能。其层间解耦特性支持分布式并行训练，为无梯度深度学习提供了新方向。

342 1 1

阿里云大数据Al技术

|

8月前

|

数据采集人工智能大数据

|

博文

演讲实录：中小企业如何快速构建AI应用？

AI时代飞速发展，大模型和AI的应用创新不断涌现，面对百花齐放的AI模型，阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台，解决企业开发难、部署繁、成本高等一系列问题，让中小企业快速搭建AI应用。

505 3 4

来自：人工智能平台PAI 版块

小白学大数据

|

8月前

|

数据采集存储 Web App开发

|

博文

如何避免爬虫因Cookie过期导致登录失效

798 7 7

蒋点数分

|

8月前

|

SQL 机器学习/深度学习数据挖掘

|

博文

【SQL周周练】给你无酸纸、变色油墨，你能伪造多少美金？

根据电影《无双》自创的 SQL 题目：假设伪钞集团每日给你供应随机数量的变色油墨、无酸纸、安全线/防伪线。请你计算每天能制作伪钞多少张，并且根据当天的情况输出第二天最缺少的材料。

158 0 0

winx_19970108018

|

8月前

|

JSON API 开发者

|

博文

天猫商品详情 API 接口：功能、调用与实战攻略

天猫商品详情API为电商从业者、开发者和数据分析人员提供高效的商品数据获取途径。通过商品ID，该接口可返回包括基本信息、价格、库存及图片等详细内容，具有高准确性、易集成和功能丰富的特点。示例代码展示了如何用Python调用此API，生成签名确保请求安全，助力用户优化定价策略、开发应用或分析市场趋势。

501 10 10

Deephub

|

8月前

|

测试技术语音技术索引

|

博文

GenPRM：思维链+代码验证，通过生成式推理的过程奖励让大模型推理准确率显著提升

本文提出GenPRM，一种生成式过程奖励模型，通过显式Chain-of-Thought推理与代码验证提升大型语言模型性能。针对传统PRMs的局限，GenPRM结合相对进展估计和监督微调，优化推理评估精度。实验表明，GenPRM在ProcessBench及数学任务中显著优于现有方法，且可通过测试时扩展进一步增强性能。然而，该方法在计算开销和跨领域应用上仍存在局限性。

249 0 0

蒋点数分

|

8月前

|

SQL 机器学习/深度学习数据挖掘

|

博文

【Uber 面试真题】SQL ：每个星期连续5星评价最多的司机

本文是【SQL周周练】系列的第一篇，作者“蒋点数分”分享了一道来自Uber面试的真题及其解法。题目要求找出每周连续获得5星好评最多的司机ID。文章详细解析了利用SQL窗口函数解决“连续”问题的思路，并通过Python和NumPy生成模拟数据，最终提供Hive SQL解答方案。后续还将涉及Streamlit应用、时间序列分析、AB实验设计等内容，欢迎关注。

242 16 17

云皓@

|

8月前

|

存储 SQL 监控

|

博文

ClickHouse 应用剖析：设计理念、机制与实践

ClickHouse 是一款高性能的列式数据库管理系统，主要用于实时的大数据分析场景。它由俄罗斯 Yandex 公司开源于 2016 年，在网页日志分析、物联网监控、广告计费等领域有广泛应用。ClickHouse 通过列式存储、向量化执行和分布式架构，实现对海量数据的快速查询分析。本文将介绍 ClickHouse 的设计理念，以及在实际使用中如何处理数据删除更新、冷热数据分离等问题，并提供常见配置的调优建议和异常问题的处理方法。

1067 14 14

Deephub

|

8月前

|

机器学习/深度学习算法数据挖掘

|

博文

PyTabKit：比sklearn更强大的表格数据机器学习框架

PyTabKit是一个专为表格数据设计的新兴机器学习框架，集成了RealMLP等先进深度学习技术与优化的GBDT超参数配置。相比传统Scikit-Learn，PyTabKit通过元级调优的默认参数设置，在无需复杂超参调整的情况下，显著提升中大型数据集的性能表现。其简化API设计、高效训练速度和多模型集成能力，使其成为企业决策与竞赛建模的理想工具。

292 12 12

Echo_Wish

|

8月前

|

边缘计算人工智能自动驾驶

|

博文

云计算的加速引擎——5G技术如何改变未来

236 7 7

Echo_Wish

|

8月前

|

安全搜索推荐大数据

|

博文

隐私守护者的觉醒——大数据时代，我们如何对抗“透明人”危机？

274 62 62

1436094676631741

|

8月前

|

API 分布式计算 MaxCompute

|

问答

MaxCompute 是否有RESTful API文档?

106 1 0

来自：大数据计算 MaxCompute 版块

灵杰开发者

|

8月前

|

存储消息中间件 Java

|

博文

抖音集团电商流量实时数仓建设实践

本文基于抖音集团电商数据工程师姚遥在Flink Forward Asia 2024的分享，围绕电商流量数据处理展开。内容涵盖业务挑战、电商流量建模架构、流批一体实践、大流量任务调优及总结展望五个部分。通过数据建模与优化，实现效率、质量、成本和稳定性全面提升，数据质量达99%以上，任务性能提升70%。未来将聚焦自动化、低代码化与成本优化，探索更高效的流批一体化方案。

577 12 12

来自：实时计算 Flink 版块

Deephub

|

8月前

|

人工智能安全搜索推荐

|

博文

SecMulti-RAG：兼顾数据安全与智能检索的多源RAG框架，为企业构建不泄密的智能搜索引擎

本文深入解析SecMulti-RAG框架，该框架通过整合企业内部知识库、预构建专家知识及受控外部大语言模型，结合保密性过滤机制，解决企业在部署AI助手时面临的信息准确性、数据安全性和成本控制问题。它采用多层策略，利用三种知识来源（动态更新的企业知识、专家预写知识和按需外部知识），并通过微调的开源LLM生成最终响应，确保安全性与性能。实验表明，SecMulti-RAG在汽车行业技术报告生成任务中显著优于传统RAG系统，展现了其在企业环境中的实用性和优势。

332 5 5

小白学大数据

|

8月前

|

机器学习/深度学习数据采集 API

|

博文

Python自动化解决滑块验证码的最佳实践

1432 2 2

Echo_Wish

|

8月前

|

人工智能算法物联网

|

博文

5G赋能工业自动化：构建未来工厂的新引擎

308 10 10

Echo_Wish

|

8月前

|

大数据数据处理数据安全/隐私保护

|

博文

数据治理，你真的合规了吗？——从代码到实践的深度解析

257 8 9

极客小俊

|

8月前

|

前端开发 JavaScript

|

博文

新手博主狂喜！用SimpleMemory一键生成高逼格博客，访客量翻了5倍的秘密在这

`SimpleMemory Theme Extension` 是一款专为博客园设计的前端美化插件，基于 `SimpleMemory` 主题开发，功能强大且易用。使用前需在博客园后台开通 JS 权限，下载最新版插件（v2.1.4）后，按照步骤配置选项、皮肤和代码。将插件中的 CSS 代码粘贴至自定义样式，并添加基础配置脚本即可完成设置，实现美观的博客效果。更多高级参数将在后续教程中详解。

169 10 10

游客a5h6d2kklbhli

|

8月前

|

DataWorks

|

问答

DataWorks 和 Dataphin 之间存在哪些区别呢？这两者是否能够共同使用？

321 0 0

来自：大数据开发治理DataWorks 版块

小白学大数据

|

8月前

|

数据采集 NoSQL 关系型数据库

|

博文

Python爬虫去重策略：增量爬取与历史数据比对

366 1 1

极客小俊

|

8月前

|

前端开发 JavaScript 开发者

|

博文

这个被忽略的CSS:hover隐藏用法，让交互设计师都跪了

本文详细介绍了CSS中的伪类选择器`:hover`及其应用。`:hover`用于定义鼠标悬停在元素上时的样式，常见于超链接、按钮等交互场景。文章通过多个实例演示了`:hover`不仅可控制当前元素，还能影响其子元素或后代元素，但通常不适用于兄弟元素。此外，还分享了如何避免`:hover`导致的布局抖动问题，如提前设置透明边框。最后，结合实际案例展示了如何利用`:hover`实现复杂的交互效果，例如三级菜单，帮助开发者更好地掌握这一实用技巧。

469 1 1

winx_19970108018

|

8月前

|

JSON API 数据格式

|

博文

深入研究：Shopee 商品详情 API 接口详解

Shopee 商品详情 API 是针对东南亚及中国台湾地区电商开发者的强大工具，可获取商品的详细信息（如价格、库存、描述等），支持竞品分析与市场调研。通过 HTTP GET/POST 请求，传入商品 ID 等参数，返回 JSON 格式的商品数据，包括基本信息、销售数据、商家信息等。以下是 Python 示例代码，展示如何使用 requests 库调用该接口并处理响应数据。注意实际应用需遵循 Shopee 认证要求。

272 1 1

Deephub

|

8月前

|

机器学习/深度学习存储数据可视化

|

博文

KG4MM：融合知识图谱与多模态数据预测药物相互作用

本文探讨了用于多模态学习的知识图谱（KG4MM）在药物相互作用（DDI）预测中的应用。知识图谱通过整合药物的分子图像和文本描述，提供结构化先验知识，指导模型关注关键信息。具体实现中，利用图神经网络（GNN）连接知识图谱与多模态数据，通过注意力机制提取最具区分性的特征。以 Goserelin 和 Desmopressin 为例，模型结合直接边关系和共享节点路径，生成透明可解释的预测结果。实验表明，KG4MM 方法显著提升了预测准确性与可解释性，为生物医学领域提供了新思路。

284 0 0

winx_19970108018

|

8月前

|

自然语言处理 API 数据安全/隐私保护

|

博文

手把手教你搭建 cssbuy 淘宝代购系统

随着全球电商的兴起，淘宝成为海外用户青睐的购物平台，但语言、支付和物流等问题限制了其直接使用。CSSBuy 等淘宝代购系统应运而生，为海外用户提供便捷的购物体验。本文详细解析如何搭建类似系统，涵盖需求分析与功能模块设计。目标用户包括海外华人、留学生及外国消费者，核心功能涉及商品搜索、代购下单、支付集成、物流管理、客服售后及多语言支持等。系统模块包括用户管理、商品管理、购物车、订单管理、支付管理、物流管理、客服售后和多语言模块，全面满足海外用户的购物需求。

378 0 0

奔跑的数据

|

8月前

|

机器学习/深度学习数据采集存储

|

博文

动态渲染页面智能嗅探：机器学习判定AJAX加载触发条件

本文介绍了一种基于机器学习的智能嗅探系统，用于自动判定动态渲染页面中AJAX加载的最佳触发时机。系统由请求分析、机器学习判定、数据采集和文件存储四大模块构成，采用爬虫代理技术实现高效IP切换，并通过模拟真实浏览器访问抓取微博热搜及评论数据。核心代码示例展示了如何调用微博接口获取榜单与评论，并利用预训练模型预测AJAX触发条件，最终将结果以JSON或CSV格式存储。该方案提升了动态页面加载效率，为信息采集与热点传播提供了技术支持。

193 15 15

Echo_Wish

|

8月前

|

数据采集搜索推荐算法

|

博文

大数据赋能零售，打造个性化购物新纪元

181 12 12

Echo_Wish

|

8月前

|

边缘计算监控数据可视化

|

博文

5G时代，开启万物互联新篇章

224 10 10

青云交（Java大数据AI云原生Python）

|

8月前

|

负载均衡算法关系型数据库

|

博文

大数据新视界--大数据大厂之MySQL数据库课程设计：MySQL集群架构负载均衡故障排除与解决方案

本文深入探讨 MySQL 集群架构负载均衡的常见故障及排除方法。涵盖请求分配不均、节点无法响应、负载均衡器故障等现象，介绍多种负载均衡算法及故障排除步骤，包括检查负载均衡器状态、调整算法、诊断修复节点故障等。还阐述了预防措施与确保系统稳定性的方法，如定期监控维护、备份恢复策略、团队协作与知识管理等。为确保 MySQL 数据库系统高可用性提供全面指导。

284 14 14

DataWorks@佳里

|

8月前

|

存储人工智能监控

|

博文

通过阿里云Milvus与通义千问VL大模型，快速实现多模态搜索

阿里云向量检索服务Milvus版是一款全托管向量检索引擎，并确保与开源Milvus的完全兼容性，支持无缝迁移。它在开源版本的基础上增强了可扩展性，能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警，Milvus云服务成为多样化AI应用场景的理想选择，包括多模态搜索、检索增强生成（RAG）、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作，进一步促进应用的快速开发和部署。

721 2 2

来自：向量检索服务 Milvus 版版块

winx_19970108018

|

8月前

|

数据采集 JSON API

|

博文

Python 实战：用 API 接口批量抓取小红书笔记评论，解锁数据采集新姿势

小红书作为社交电商的重要平台，其笔记评论蕴含丰富市场洞察与用户反馈。本文介绍的小红书笔记评论API，可获取指定笔记的评论详情（如内容、点赞数等），支持分页与身份认证。开发者可通过HTTP请求提取数据，以JSON格式返回。附Python调用示例代码，帮助快速上手分析用户互动数据，优化品牌策略与用户体验。

1533 3 3

阿里云大数据Al技术

|

8月前

|

人工智能边缘计算前端开发

|

博文

人工智能平台 PAI DistilQwen2.5-DS3-0324发布：知识蒸馏+快思考=更高效解决推理难题

DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列，包括DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。DistilQwen2.5-DS3-0324 系列模型是基于 DeepSeek-V3-0324 通过知识蒸馏技术并引入快思考策略构建，显著提升推理速度，使得在资源受限的设备和边缘计算场景中，模型能够高效执行复杂任务。实验显示，DistilQwen2.5-DS3-0324 系列中的模型在多个基准测试中表现突出，其32B模型效果接近参数量接近其10倍的闭源大模型。

922 56 56

来自：人工智能平台PAI 版块

奔跑的数据

|

8月前

|

机器学习/深度学习数据采集存储

|

博文

深度学习在DOM解析中的应用：自动识别页面关键内容区块

本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈，采用代理复用、批量推理、多线程并发及模型量化等策略，将单页耗时从5秒优化至2秒，提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取，确保高效稳定运行，为大规模数据采集提供参考。

217 0 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

立马耀：通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统，驱动个性化推荐业务

PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit

鹰角网络：EMR Serverless Spark 在《明日方舟》游戏业务的应用

中国联通网络资源湖仓一体应用实践

钉钉考勤机8点前，1个人在2台考勤机上分别打卡，但只推送1次打卡记录。接口也只能调到一次记录，如何改

五分钟看懂推送本地项目到 GitHub新手菜鸡

产品工作流程 - AxureMost

零训练成本优化LLM： 11种LLM权重合并策略原理与MergeKit实战配置

使用标注好的csv文件进行文本识别训练时，老是报错：标签列没有正确加载为ClassLabel类型

京东商品列表 API 接口全解析：从入门到精通

手把手教你调用京东商品详情 API：从申请到数据抓取全流程

5G落地没那么简单！细扒部署挑战与硬核解决方案

﻿别再野蛮操作了！用Python优雅地搞定数据清洗

【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位？

云上玩转DeepSeek系列之六：DeepSeek云端加速版发布，具备超高推理性能

如何用大模型+RAG 给宠物做一个 AI 健康助手？——阿里云 AI 搜索开放平台

阿里云产品四月刊来啦

千万级数据秒级响应！碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

NoProp：无需反向传播，基于去噪原理的非全局梯度传播神经网络训练，可大幅降低内存消耗

演讲实录：中小企业如何快速构建AI应用？

如何避免爬虫因Cookie过期导致登录失效

【SQL周周练】给你无酸纸、变色油墨，你能伪造多少美金？

天猫商品详情 API 接口：功能、调用与实战攻略

GenPRM：思维链+代码验证，通过生成式推理的过程奖励让大模型推理准确率显著提升

【Uber 面试真题】SQL ：每个星期连续5星评价最多的司机

ClickHouse 应用剖析：设计理念、机制与实践

PyTabKit：比sklearn更强大的表格数据机器学习框架

云计算的加速引擎——5G技术如何改变未来

隐私守护者的觉醒——大数据时代，我们如何对抗“透明人”危机？

MaxCompute 是否有RESTful API文档?

抖音集团电商流量实时数仓建设实践

SecMulti-RAG：兼顾数据安全与智能检索的多源RAG框架，为企业构建不泄密的智能搜索引擎

Python自动化解决滑块验证码的最佳实践

5G赋能工业自动化：构建未来工厂的新引擎

数据治理，你真的合规了吗？——从代码到实践的深度解析﻿

新手博主狂喜！用SimpleMemory一键生成高逼格博客，访客量翻了5倍的秘密在这

DataWorks 和 Dataphin 之间存在哪些区别呢？这两者是否能够共同使用？

Python爬虫去重策略：增量爬取与历史数据比对

这个被忽略的CSS:hover隐藏用法，让交互设计师都跪了

深入研究：Shopee 商品详情 API 接口详解

KG4MM：融合知识图谱与多模态数据预测药物相互作用

手把手教你搭建 cssbuy 淘宝代购系统

动态渲染页面智能嗅探：机器学习判定AJAX加载触发条件

﻿大数据赋能零售，打造个性化购物新纪元

5G时代，开启万物互联新篇章

大数据新视界--大数据大厂之MySQL数据库课程设计：MySQL集群架构负载均衡故障排除与解决方案

通过阿里云Milvus与通义千问VL大模型，快速实现多模态搜索

Python 实战：用 API 接口批量抓取小红书笔记评论，解锁数据采集新姿势

人工智能平台 PAI DistilQwen2.5-DS3-0324发布：知识蒸馏+快思考=更高效解决推理难题

深度学习在DOM解析中的应用：自动识别页面关键内容区块

大数据与机器学习

活跃用户

相关产品

别再野蛮操作了！用Python优雅地搞定数据清洗

数据治理，你真的合规了吗？——从代码到实践的深度解析

大数据赋能零售，打造个性化购物新纪元