大数据与机器学习-最热-第20页-阿里云开发者社区

Echo_Wish

|

9月前

|

分布式计算大数据数据处理

|

博文

从Excel到大数据：别让工具限制你的思维！

333 85 86

winx_19970108018

|

9月前

|

供应链搜索推荐 API

|

博文

亚马逊的商品列表数据接口为电商从业者、数据分析人员和开发者提供了宝贵的市场洞察。通过该接口，用户可以批量获取商品的关键信息，包括基本信息、价格、销售排名和库存状态等，助力市场分析、竞品研究和商品推荐。开发者需在亚马逊开发者中心注册并申请API权限，使用安全凭证进行认证，支持HTTP/HTTPS协议的GET和POST请求。Python示例展示了如何调用接口获取商品列表，并解析响应数据。应用场景涵盖市场趋势分析、竞品对比、个性化推荐及库存管理，帮助商家优化策略，提升竞争力。

455 13 14

winx_19970108018

|

9月前

|

监控供应链搜索推荐

|

博文

亚马逊商品详情接口（亚马逊 API 系列）

亚马逊作为全球最大的电商平台之一，提供了丰富的商品资源。开发者和电商从业者可通过亚马逊商品详情接口获取商品的描述、价格、评论、排名等数据，对市场分析、竞品研究、价格监控及业务优化具有重要价值。接口基于MWS服务，支持HTTP/HTTPS协议，需注册并获得API权限。Python示例展示了如何使用mws库调用接口获取商品详情。应用场景包括价格监控、市场调研、智能选品、用户推荐和库存管理等，助力电商运营和决策。

543 23 27

赵渝强老师

|

9月前

|

分布式计算 Spark

|

博文

【赵渝强老师】Spark的容错机制：检查点

Spark通过Checkpoint机制将RDD状态持久化到磁盘，以支持容错。当任务执行出错时，可以从检查点位置重新计算，减少开销。Checkpoint目录可设置为本地文件夹或HDFS。建议生产系统使用高可靠的文件系统保存检查点。文中详细介绍了在本地和HDFS上设置检查点目录的步骤，并附有代码示例和视频讲解。

195 7 7

来自：大数据计算 MaxCompute 版块

游客jnstwksgqnrgi

|

9月前

|

机器学习/深度学习人工智能并行计算

|

博文

图机器学习调研洞察：PyG与DGL

图神经网络（GNN）是人工智能领域的研究热点，广泛应用于社交网络、电商推荐、欺诈检测等。主流开源图学习引擎如DGL、PyG、GraphScope等在性能和社区活跃度上各有优劣。基于ogbn-products数据集的测试显示，DGL性能最优、内存占用最低，PyG次之。在AI for Science领域，PyG应用更广泛，尤其在小分子和晶体结构预测中表现突出。DGL采用Graph Centric方式，保留图结构；PyG则采用Tensor Centric方式，适合小图场景。

346 1 1

Deephub

|

9月前

|

存储算法数据挖掘

|

博文

数据降维技术研究：Karhunen-Loève展开与快速傅里叶变换的理论基础及应用

本文探讨了Karhunen-Loève展开（KLE）和快速傅里叶变换（FFT）在数据降维与压缩中的应用。KLE通过最优正交基函数系统分解随机过程，适用于高维随机场的降维；FFT则将时域信号转换为频域表示，擅长处理周期性信号。两者结合可实现多尺度数据分析，在气象、工程等领域有广泛应用。

243 16 16

游客dnnykpmxhck3i

|

9月前

|

人工智能算法 Cloud Native

|

博文

华为、埃森哲都在用的培训法则：3大战场拆解与8家破局者图谱

但当企业竞争进入“深水区”，当AI技术以周为单位迭代时，堆砌知识量 → 标准化课件 → 单向灌输这套模式注定失效。真正的破局者在哪里？那些能将培训嵌入业务毛细血管，用真实项目倒逼能力跃迁，靠前沿技术直击行业痛点的机构，正在改写游戏规则。

239 40 42

Deephub

|

10月前

|

机器学习/深度学习存储 Python

|

博文

深入剖析SVM核心机制：铰链损失函数的原理与代码实现

铰链损失（Hinge Loss）是支持向量机（SVM）中核心的损失函数，广泛应用于机器学习模型训练。其数学形式为 \( L(y, f(x)) = \max(0, 1 - y \cdot f(x)) \)，其中 \( y \) 是真实标签，\( f(x) \) 是预测输出。铰链损失具有凸性、非光滑性和稀疏性等特性，能够最大化分类边际并产生稀疏的支持向量，提高模型泛化能力。它在正确分类、边际内分类和错误分类三种情况下有不同的损失值，适用于线性可分问题且对异常值不敏感。铰链损失通过严格的边际要求和连续梯度信息，提供了高效的优化目标，适合构建鲁棒的分类模型。

572 77 78

游客yoh4w6jvuxebs

|

10月前

|

数据可视化数据挖掘数据处理

|

博文

B 端试用期考核指标

B端产品经理试用期考核指标涵盖了项目策划、用户需求理解、团队协作、技术能力、创新思维、项目管理、产品投放时间、产品质量、产品利润及基础服务接入等方面。这些指标通过自我评估和上级评估相结合的方式进行，分为优秀（5分）到不合格（1分）五个等级。具体内容包括制定合理项目计划、准确把握用户需求、有效沟通协调团队、掌握技术细节、提出创新方案等。实际案例展示了如何通过成功项目实施、解决业务痛点、优化产品功能等方式，全面评估产品经理的综合能力，确保其胜任后续工作任务。

415 0 0

Echo_Wish

|

10月前

|

搜索推荐算法大数据

|

博文

本次分享将分为四个部分讲解：第一部分探讨AI时代数据开发范式的演变，特别是MaxCompute自研大数据平台在客户工作负载和任务类型变化下的影响。第二部分介绍MaxCompute在资源大数据平台上构建的Data + AI核心能力，提供一站式开发体验和流程。第三部分展示MaxCompute Data + AI的一站式开发体验，涵盖多模态数据管理、交互式开发环境及模型训练与部署。第四部分分享成功落地的客户案例及其收益，包括互联网公司和大模型训练客户的实践，展示了MaxFrame带来的显著性能提升和开发效率改进。

645 7 9

来自：大数据计算 MaxCompute 版块

Deephub

|

11月前

|

IDE 测试技术开发工具

|

博文

10个必备Python调试技巧：从pdb到单元测试的开发效率提升指南

在Python开发中，调试是提升效率的关键技能。本文总结了10个实用的调试方法，涵盖内置调试器pdb、breakpoint()函数、断言机制、logging模块、列表推导式优化、IPython调试、警告机制、IDE调试工具、inspect模块和单元测试框架的应用。通过这些技巧，开发者可以更高效地定位和解决问题，提高代码质量。

1045 8 8

不游泳的鱼鱼

|

11月前

|

人工智能搜索推荐数据库

|

博文

主动式智能导购AI助手构建方案评测

阿里云推出的主动式智能导购AI助手方案，基于百炼大模型和Multi-Agent架构，通过多轮对话收集用户需求，实现精准商品推荐。其优势包括主动交互、灵活可扩展的架构、低代码开发及快速部署。商家可在10分钟内完成部署，并享受低成本试用。尽管技术细节尚需完善，该方案为电商提供了高效的客户服务工具，未来有望在个性化推荐和多模态交互方面取得突破。

341 3 3

来自：智能搜索推荐版块

ZOMI酱

|

11月前

|

机器学习/深度学习人工智能算法

|

博文

【AI系统】AI 框架之争

本文介绍了AI框架在数学上对自动微分的表达和处理，以及其在多线程算子加速、GPU/NPU支持、代码编译优化等方面的技术挑战。文章详细梳理了AI框架的发展历程，从萌芽阶段到深化阶段，探讨了不同阶段的关键技术和代表性框架。同时，文章展望了AI框架的未来趋势，包括全场景支持、易用性提升、大规模分布式支持和科学计算融合。

318 0 0

游客7q6odlcu3jr5c

|

11月前

|

数据采集 JSON API

|

博文

淘宝商品数据采集API技术分享

在电商领域，数据采集和分析对提升业务效率、优化用户体验至关重要。淘宝作为国内最大电商平台之一，提供了丰富的商品数据。通过淘宝商品采集API，开发者可高效获取这些数据，支持决策。本文详细介绍了如何注册、申请权限、构建请求、处理响应及注意事项，助力商家和开发者利用API进行商品数据采集。

1522 4 4

winx_19970108018

|

11月前

|

XML JSON 缓存

|

博文

阿里巴巴商品详情数据接口（alibaba.item_get) 丨阿里巴巴 API 实时接口指南

阿里巴巴商品详情数据接口（alibaba.item_get）允许商家通过API获取商品的详细信息，包括标题、描述、价格、销量、评价等。主要参数为商品ID（num_iid），支持多种返回数据格式，如json、xml等，便于开发者根据需求选择。使用前需注册并获得App Key与App Secret，注意遵守使用规范。

484 6 6

软件算法开发

|

11月前

|

算法

|

博文

基于GA遗传算法的PID控制器参数优化matlab建模与仿真

本项目基于遗传算法（GA）优化PID控制器参数，通过空间状态方程构建控制对象，自定义GA的选择、交叉、变异过程，以提高PID控制性能。与使用通用GA工具箱相比，此方法更灵活、针对性强。MATLAB2022A环境下测试，展示了GA优化前后PID控制效果的显著差异。核心代码实现了遗传算法的迭代优化过程，最终通过适应度函数评估并选择了最优PID参数，显著提升了系统响应速度和稳定性。

692 15 15

Deephub

|

12月前

|

SQL 并行计算数据挖掘

|

博文

一份写给数据工程师的 Polars 迁移指南：将 Pandas 速度提升 20 倍代码重构实践

Polars作为现代化的数据处理框架，通过先进的工程实践和算法优化，为数据科学工作者提供了高效的数据处理工具。在从Pandas迁移时，理解这些核心概念和最佳实践将有助于充分发挥Polars的性能优势。

725 4 4

路卿老师

|

12月前

|

前端开发 Java 数据库连接

|

博文

你不可不知道的JAVA EE 框架有哪些？

本文介绍了框架的基本概念及其在编程领域的应用，强调了软件框架作为通用、可复用的软件环境的重要性。文章分析了早期Java EE开发中使用JSP+Servlet技术的弊端，包括可维护性差和代码重用性低等问题，并阐述了使用框架的优势，如提高开发效率、增强代码规范性和可维护性及提升软件性能。最后，文中详细描述了几种主流的Java EE框架，包括Spring、Spring MVC、MyBatis、Hibernate和Struts 2，这些框架通过提供强大的功能和支持，显著提升了Java EE应用的开发效率和稳定性。

659 1 1

Deephub

|

12月前

|

并行计算监控搜索推荐

|

博文

使用 PyTorch-BigGraph 构建和部署大规模图嵌入的完整教程

当处理大规模图数据时，复杂性难以避免。PyTorch-BigGraph (PBG) 是一款专为此设计的工具，能够高效处理数十亿节点和边的图数据。PBG通过多GPU或节点无缝扩展，利用高效的分区技术，生成准确的嵌入表示，适用于社交网络、推荐系统和知识图谱等领域。本文详细介绍PBG的设置、训练和优化方法，涵盖环境配置、数据准备、模型训练、性能优化和实际应用案例，帮助读者高效处理大规模图数据。

249 5 6

赵渝强老师

|

12月前

|

存储缓存分布式计算

|

博文

【赵渝强老师】基于RBF的HDFS联邦架构

最新版Hadoop实现了基于Router的联盟架构，增强了集群管理能力。Router将挂载表从客户端中分离，解决了ViewFS的问题。RBF架构包括Router和State Store两个模块，其中Router作为代理服务，负责解析ViewFS并转发请求至正确子集群，State Store则维护子集群的状态和挂载表信息。

284 0 0

赵渝强老师

|

12月前

|

SQL 数据采集分布式计算

|

博文

【赵渝强老师】基于大数据组件的平台架构

本文介绍了大数据平台的总体架构及各层的功能。大数据平台架构分为五层：数据源层、数据采集层、大数据平台层、数据仓库层和应用层。其中，大数据平台层为核心，负责数据的存储和计算，支持离线和实时数据处理。数据仓库层则基于大数据平台构建数据模型，应用层则利用这些模型实现具体的应用场景。文中还提供了Lambda和Kappa架构的视频讲解。

956 3 3

灵杰开发者

|

12月前

|

人工智能架构师

|

博文

活动火热报名中｜阿里云&Elastic：AI Search Tech Day

2024年11月22日，阿里云与Elastic联合举办“AI Search Tech Day”技术思享会活动。

430 9 9

来自：检索分析服务 Elasticsearch版版块

Echo_Wish

|

12月前

|

机器学习/深度学习数据采集数据库

|

博文

使用Python实现智能食品营养分析的深度学习模型

460 6 6

Echo_Wish

|

13天前

|

人工智能自然语言处理前端开发

|

博文

蒋星熠Jaxonic带你深入卷积神经网络（CNN）核心技术，从生物启发到数学原理，详解ResNet、注意力机制与模型优化，探索视觉智能的演进之路。

327 11 11

Deephub

|

3月前

|

人工智能自然语言处理安全

|

博文

多智能体协作为什么这么难：系统频繁失败的原因分析与解决思路

在AI智能体架构设计中，单智能体与多智能体路径之争愈演愈烈。实践表明，多智能体系统虽看似强大，却因协调复杂、容错差、信息丢失等问题而表现脆弱。相比之下，具备完整上下文的单智能体在一致性、稳定性与可维护性上更具优势。本文深入分析多智能体系统的失败案例与技术局限，提出优先发展高性能单智能体、聚焦上下文工程的实践路径，为AI系统设计提供清晰方向。

217 4 4

灵杰开发者

|

3月前

|

SQL 运维监控

|

博文

抖音基于Flink的DataOps能力实践

本文整理自抖音集团数据工程师黄鑫在Flink Forward Asia 2024的分享，围绕抖音实时数据研发的现状与挑战、DataOps能力建设及未来规划展开，涵盖需求管理、开发测试、发布运维等全流程实践，旨在提升数据质量与开发效率，实现高效稳定的数据交付。

226 18 18

来自：实时计算 Flink 版块

winx_19970108018

|

3月前

|

JSON API 数据格式

|

博文

小红书笔记详情API数据解析（附代码）

本内容介绍了小红书开放平台的笔记详情API接口功能，涵盖笔记标题、内容、互动数据及多媒体资源的获取方式。提供接口概述、请求方式及Python调用示例，适用于内容分析与营销策略优化，帮助开发者高效集成与使用。

409 4 4

Echo_Wish

|

3月前

|

运维算法 5G

|

博文

天上的“WiFi”：低轨卫星互联网正在改变全球通信格局

182 5 5

Echo_Wish

|

3月前

|

自然语言处理 5G 语音技术

|

博文

5G加持下的实时翻译：从“卡顿”到“秒懂”的进化之路

110 1 1

灵杰开发者

|

3月前

|

存储消息中间件人工智能

|

博文

Lazada 如何用实时计算 Flink + Hologres 构建实时商品选品平台

本文整理自 Lazada Group EVP 及供应链技术负责人陈立群在 Flink Forward Asia 2025 新加坡实时分析专场的分享。作为东南亚领先的电商平台，Lazada 面临在六国管理数十亿商品 SKU 的挑战。为实现毫秒级数据驱动决策，Lazada 基于阿里云实时计算 Flink 和 Hologres 打造端到端实时商品选品平台，支撑日常运营与大促期间分钟级响应。本文深入解析该平台如何通过流式处理与实时分析技术重构电商数据架构，实现从“事后分析”到“事中调控”的跃迁。

368 55 56

来自：实时计算 Flink 版块

Echo_Wish

|

3月前

|

存储人工智能 5G

|

博文

6G来了，智能设备会“脱胎换骨”吗？

150 4 4

Deephub

|

3月前

|

人工智能测试技术芯片

|

博文

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

本文介绍了使用四块Framework主板构建AI推理集群的过程，并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试，重点评估其并行推理能力及集群表现。

255 0 0

Deephub

|

3月前

|

人工智能自然语言处理算法

|

博文

提升LangChain开发效率：10个被忽视的高效组件，让AI应用性能翻倍

LangChain作为主流大语言模型应用框架，其高级组件常被忽视。本文详解10个高价值但低使用率的核心组件，如语义检索、多模板路由、智能查询转换等，结合技术原理与实践案例，助开发者构建更高效、智能、适应性强的AI系统，提升应用性能与业务价值。

284 0 0

winx_19970108018

|

3月前

|

JSON API 数据格式

|

博文

天猫商品评论API响应数据解析

天猫商品评论API是淘宝开放平台提供的数据接口，支持获取评论内容、评分、时间等信息，具备筛选、分页功能，适用于电商数据分析与用户行为研究。

103 0 0

青云交（Java大数据AI云原生Python）

|

3月前

|

机器学习/深度学习运维 Java

|

博文

Java 大视界 -- 基于 Java 的大数据实时流处理在能源行业设备状态监测与故障预测中的应用（210）

本篇文章探讨了基于 Java 的大数据实时流处理技术在能源行业设备状态监测与故障预测中的应用。文章分析了传统能源设备运维的局限性，如人工巡检效率低、数据处理滞后等问题，并引入 Java 大数据技术作为解决方案。通过实时流处理引擎如 Apache Flink，实现多源异构数据的采集、清洗与异常检测，提升了设备监测的实时性与准确性。同时，文章还介绍了数字孪生、边缘计算等前沿技术的融合应用，并结合国家电网和海上风电场的实际案例，展示了 Java 大数据技术在提升运维效率、降低故障风险和节约成本方面的显著效果。

134 0 0

Deephub

|

3月前

|

机器学习/深度学习算法测试技术

|

博文

NSA稀疏注意力深度解析：DeepSeek如何将Transformer复杂度从O(N²)降至线性，实现9倍训练加速

本文将深入分析NSA的架构设计，通过详细的示例、可视化展示和数学推导，构建对其工作机制的全面理解，从高层策略到底层硬件实现均有涉及。

331 0 0

青云交（Java大数据AI云原生Python）

|

4月前

|

传感器机器学习/深度学习算法

本文介绍了基于华为鲲鹏ARM架构服务器与openEuler操作系统，构建包含HDFS、ZooKeeper、Flink、Fluss及Paimon的实时大数据环境的完整实战过程。涵盖了软硬件配置、组件部署、集群规划、环境变量设置、安全认证及启停脚本编写等内容，适用于企业级实时数据平台搭建与运维场景。

622 0 0

来自：实时计算 Flink 版块

1751547310585090

|

4月前

|

问答

通义qwen-turbo-latest，突然变老外，回答都是英文，接口这么大变动吗

120 0 0

winx_19970108018

|

4月前

|

监控 API 开发者

|

博文

淘宝店铺商品API响应数据解析

淘宝店铺商品API是淘宝开放平台的核心接口，支持开发者高效获取店铺内全部商品信息，广泛应用于电商数据分析、竞品监控等场景。相比人工采集，效率提升90%以上。接口支持商品列表查询、多维度筛选、多种排序方式，并可结合其他接口获取扩展信息。本文提供Python请求示例，完整实现签名生成、参数构造和异常处理。

110 1 1

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

从Excel到大数据：别让工具限制你的思维！

亚马逊商品列表数据接口（亚马逊 API 系列）

亚马逊商品详情接口（亚马逊 API 系列）

【赵渝强老师】Spark的容错机制：检查点

图机器学习调研洞察：PyG与DGL

数据降维技术研究：Karhunen-Loève展开与快速傅里叶变换的理论基础及应用

华为、埃森哲都在用的培训法则：3大战场拆解与8家破局者图谱

深入剖析SVM核心机制：铰链损失函数的原理与代码实现

B 端试用期考核指标

大数据无处不在：揭秘日常生活中的大数据魔力

京东商品列表 API 接口系列（京东 API）

DataWorks年度发布：智能化湖仓一体数据开发与治理平台的演进

MaxCompute Data + AI：构建 Data + AI 的一体化数智融合

10个必备Python调试技巧：从pdb到单元测试的开发效率提升指南

主动式智能导购AI助手构建方案评测

【AI系统】AI 框架之争

淘宝商品数据采集API技术分享

阿里巴巴商品详情数据接口（alibaba.item_get) 丨阿里巴巴 API 实时接口指南

基于GA遗传算法的PID控制器参数优化matlab建模与仿真

一份写给数据工程师的 Polars 迁移指南：将 Pandas 速度提升 20 倍代码重构实践

你不可不知道的JAVA EE 框架有哪些？

使用 PyTorch-BigGraph 构建和部署大规模图嵌入的完整教程

【赵渝强老师】基于RBF的HDFS联邦架构

【赵渝强老师】基于大数据组件的平台架构

活动火热报名中｜阿里云&Elastic：AI Search Tech Day

使用Python实现智能食品营养分析的深度学习模型

AI Agents 崛起：让 AI 自己“干活”的时代，终于来了！

WorldSimBench: 迈向作为世界模拟器的视频生成模型——论文阅读

19c多租户架构下的UNDO管理- Local Undo

卷积神经网络深度解析：从基础原理到实战应用的完整指南

多智能体协作为什么这么难：系统频繁失败的原因分析与解决思路

抖音基于Flink的DataOps能力实践

小红书笔记详情API数据解析（附代码）

天上的“WiFi”：低轨卫星互联网正在改变全球通信格局

5G加持下的实时翻译：从“卡顿”到“秒懂”的进化之路

Lazada 如何用实时计算 Flink + Hologres 构建实时商品选品平台

6G来了，智能设备会“脱胎换骨”吗？

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

提升LangChain开发效率：10个被忽视的高效组件，让AI应用性能翻倍

天猫商品评论API响应数据解析

Java 大视界 -- 基于 Java 的大数据实时流处理在能源行业设备状态监测与故障预测中的应用（210）

NSA稀疏注意力深度解析：DeepSeek如何将Transformer复杂度从O(N²)降至线性，实现9倍训练加速

Java 大视界 -- Java 大数据在智能农业温室环境调控与作物生长模型构建中的应用（189）

阿里云学生服务器应该如何选择配置

MoR vs MoE架构对比：更少参数、更快推理的大模型新选择

Java 技术栈企业级应用开发全流程

搜索结果太乱？5种重排序模型让你的搜索系统准确率提升40%

Fluss on 鲲鹏 openEuler 大数据实战

通义qwen-turbo-latest，突然变老外，回答都是英文，接口这么大变动吗

淘宝店铺商品API响应数据解析

大数据与机器学习

活跃用户

相关产品