大数据与机器学习-最新-阿里云开发者社区

阿里云大数据Al技术

|

人工智能算法云栖大会

|

技术作品

置顶

开启云上 AIGC 动手实践，探索技术创意

面向 GenAI 时代，阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践，提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程，覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域，为您带来 AIGC 开发全新体验。

972 131

来自：人工智能平台PAI 版块

游客vv4u4wyick5ti

|

3小时前

|

SQL 人工智能运维

|

博文

Snowflake SVA vs Aloudata CAN：两种语义层哲学的深度对比

在 AI Agent 时代，语义层不是一个品类选择题，而是一个基础设施必答题。

21 2 2

cj47yycoa2a56

|

5小时前

|

缓存项目管理开发工具

|

博文

UV实战教程，我啥要从Anaconda切换到uv来管理包？

本文对比Anaconda“手动挡”与uv“全自动挡”环境管理：uv以“项目即环境”为核心，支持`uv init`一键初始化、自动下载Python、智能依赖管理（`uv add/sync/run`）及PyCharm无缝对接，大幅提升Python开发效率与协作体验。（239字）

43 11 11

刘大猫.

|

16小时前

|

Java 调度

|

博文

java工具：《Java获取明日零点时间工具方法》

34 5 5

winx_19970108018

|

21小时前

|

机器学习/深度学习 JSON 供应链

|

博文

1688图片搜索API（拍立淘）实操指南

1688图片搜索API（拍立淘/以图搜货）是官方图像搜品接口，支持图片URL或Base64输入，秒级返回同款/相似商品ID、标题、价格等结构化数据，精准高效，适用于反向海淘、供应链寻源、比价选品等场景。

42 0 0

winx_19970108018

|

21小时前

|

自然语言处理安全数据可视化

|

博文

LitBuy反向海淘代购系统搭建指南

本平台提供“链接代购+集运”一站式跨境服务：海外用户粘贴淘宝/1688链接，系统自动解析、代采、合箱质检、国际配送。核心盈利来自物流差价、代购费、汇率差及增值服务。支持多语言、多币种、主流跨境支付与全链路追踪。（239字）

33 2 2

Echo_Wish

|

1天前

|

分布式计算 Kubernetes Spark

|

博文

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

75 7 7

Echo_Wish

|

1天前

|

机器学习/深度学习 PyTorch TensorFlow

|

博文

从 0 到 1 写一个神经网络训练循环：别再只会 `model.fit()` 了

65 7 7

winx_19970108018

|

2天前

|

机器学习/深度学习编解码 JSON

|

博文

从踩坑到高效落地：淘宝拍立淘图片搜索API的实操心得

淘宝拍立淘API提供高精度以图搜品服务，支持Base64/URL传图，基于MobileNet/ResNet提取200+图像特征，毫秒级匹配相似商品。关键需控主体占比≥70%、签名严格ASCII排序、阈值设0.8，单次返回50条结构化结果。（239字）

89 3 3

AI小怪兽

|

2天前

|

机器学习/深度学习人工智能算法

|

博文

SEP-YOLO：当频域分析遇上YOLO，透明物体实例分割迎来新突破，ISCAS 2026

本文提出SEP-YOLO框架，首创频域细节增强模块（可学习复数权重强化高频边界）、多尺度空间细化流（内容感知对齐+门控细化），并为Trans10K提供首个高质量实例标注。在Trans10K/GVD上mAP50超SOTA 3%+，兼顾精度与实时性。

76 5 5

刘大猫.

|

2天前

|

Java

|

博文

java工具：《Java获取昨日零点时间工具方法》

53 9 9

Echo_Wish

|

2天前

|

机器学习/深度学习 PyTorch TensorFlow

|

博文

PyTorch vs TensorFlow：谁才是深度学习界的“顺手兵器”？一次接地气的实战对比

65 4 4

Echo_Wish

|

2天前

|

运维分布式计算 Cloud Native

|

博文

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

50 4 4

winx_19970108018

|

2天前

|

数据采集缓存自然语言处理

|

博文

acbuy模式反向海淘淘宝1688系统搭建经验

Acbuy是面向海外用户的反向海淘平台，整合淘宝/1688代购与集运服务：用户粘贴链接下单→平台批量采购→国内仓验货合箱→专线物流清关直达。支持多语言、多支付、自动换算与风控合规，主打高性价比、一站式跨境购物体验。（239字）

85 7 7

winx_19970108018

|

2天前

|

监控数据挖掘 API

|

博文

从踩坑到高效落地：淘宝商品详情API的实操心得

淘宝商品详情API提供全维度商品数据，含基础信息、详情页HTML、SKU、价格、销量等，支持比价、代购、数据分析及内容电商等场景，涵盖item.get、item.get_pro等核心接口，接入便捷高效。

55 4 4

Echo_Wish

|

3天前

|

缓存人工智能监控

|

博文

当大模型开始“碎碎念”：聊聊大模型日志分析与调优系统是怎么设计的

53 3 3

Echo_Wish

|

3天前

|

数据采集人工智能数据处理

|

博文

别只盯着模型参数了：聊聊多模态时代最容易被忽视的一件事——训练数据准备

53 4 4

刘大猫.

|

3天前

|

Java

|

博文

java工具：《Java日期格式化完全指南：从Date到String的优雅转换》

42 1 1

游客42mreuswm64wq

|

4天前

|

机器学习/深度学习人工智能 JSON

|

博文

AI 术语满天飞？90% 的人只懂名词，不懂为什么！

本文不堆砌概念，只讲前因后果：从大模型底层逻辑，到 Context、RAG、Function Calling、MCP、Skills 的核心关联，拆解所有面试高频考点，让你告别 “名词解释”，吃透原理，面试直接碾压面试官！

208 6 6

游客hmcsyzc6sa4ju

|

4天前

|

人工智能 vr&ar 开发工具

|

博文

基于 Rokid 灵珠与 UXR 3.0 的 AR 智能卡路里识别系统实战

本项目为“AR智能卡路里计算器”，基于Rokid灵珠（AR Lite/Studio）与UXR 3.0 SDK开发。用户佩戴眼镜直视食物，系统通过空间计算实时识别并弹出热量数据，支持水果/正餐双模式切换。采用程序化3D建模、零美术资源依赖、多模态交互（键鼠→手柄→手势捏合），实现“空间即看即得”的沉浸式健康饮食辅助体验。（239字）

67 3 3

刘大猫.

|

4天前

|

存储 Java

|

博文

java工具：String转Long（日期格式字符串转为时间毫秒数）

56 5 5

Echo_Wish

|

4天前

|

人工智能监控 Kubernetes

|

博文

不想再被 API 账单吓一跳？教你用 Python 搭一个本地大模型推理 API

128 1 1

Echo_Wish

|

4天前

|

机器学习/深度学习人工智能分布式计算

|

博文

AI 会写稿了，人还要不要写？——聊聊生成式 AI 在数据增强与自动写稿里的伦理和质量问题

69 1 1

winx_19970108018

|

4天前

|

自然语言处理安全 JavaScript

|

博文

Cnfans 反向海淘代购系统搭建经验

面向欧美的淘宝/1688代购集运平台，支持链接粘贴→自动抓取翻译计价→多币种支付→代采合包→国际物流清关→末端派送。集成PayPal/Stripe、4PX等API，采用Vue+FastAPI+Docker技术栈，合规覆盖IOSS、GDPR及仿牌审核，盈利含服务费、物流差价与增值服务。（239字）

61 2 2

Echo_Wish

|

5天前

|

自然语言处理 PyTorch 算法框架/工具

|

博文

大模型太慢？别急着上 GPU 堆钱：Python + ONNX Runtime 优化推理性能实战指南

135 10 10

Echo_Wish

|

5天前

|

机器学习/深度学习数据采集搜索推荐

|

博文

日志不是垃圾，是金矿：聊聊基于日志的大规模用户行为建模如何撑起推荐系统

53 5 5

刘大猫.

|

5天前

|

Java

|

博文

java工具：Long转String（时间毫秒数转日期格式字符串）

91 2 2

Java开发者

|

6天前

|

Java 调度开发者

|

博文

Java AQS：JUC 并发体系的底层同步框架基石

AQS（AbstractQueuedSynchronizer）是Java并发包（JUC）的底层核心，以volatile state + CLH双向队列统一实现同步控制。支持独占（如ReentrantLock）与共享（如Semaphore、CountDownLatch）两种模式，通过模板方法封装排队、阻塞/唤醒等通用逻辑，是理解与定制高性能同步组件的关键基石。（239字）

107 7 7

Devnullcoffee

|

6天前

|

数据采集人工智能监控

|

博文

Amazon竞品调价实时预警系统：OpenClaw AI Agent + Pangolinfo API 企业级落地实践

本方案为跨境电商打造实时竞品价格监控系统：通过Pangolinfo API每10分钟采集ASIN数据，OpenClaw AI Agent智能分析降价威胁并生成应对建议，飞书/Slack即时推送富文本告警。响应速度从24小时提升至10分钟（加速144倍），年ROI超10倍，开发仅需1–2天。（239字）

87 3 3

刘大猫.

|

6天前

|

Java

|

博文

java工具：检测一个字符串是否是时间格式

62 5 5

奔跑的数据

|

6天前

|

数据采集网络协议 API

|

博文

从提取式API到隧道代理：提升爬虫稳定性的5个核心秘籍

本文讨论了五个关键细节以优化爬虫代理使用：使用隧道代理、合理设置超时、利用连接池、引入重试机制、伪装请求头。通过隧道代理的实战代码示例，展示了如何实现这些优化，以提高爬虫的稳定性和效率。

158 2 2

winx_19970108018

|

6天前

|

数据采集缓存自然语言处理

|

博文

LitBuy模式反向海淘系统（欧美淘宝/1688代购）搭建指南

LitBuy是面向海外用户的中国商品代购集运平台，支持粘贴淘宝/1688链接一键下单，提供多语言、多支付、智能合箱与全程物流追踪。核心盈利来自物流差价、代购服务费及增值服务，技术架构基于Next.js+Java/Node.js微服务，部署于AWS/阿里云国际节点。（239字）

89 0 0

winx_19970108018

|

6天前

|

XML JSON 监控

|

博文

阐述：关键词搜索京东商品列表API接口

京东关键词搜索商品列表API是其开放平台核心接口，支持按关键词检索商品，提供多条件筛选、分页排序及丰富字段（价格、销量、店铺、库存等），适用于选品、竞品分析、价格监控与联盟推广，需AppKey+签名认证。

64 0 0

c的前世今生

|

7天前

|

编译器程序员 C语言

|

博文

C语言深度解析：未定义行为（UB）—— 90%玄学bug的根源

C语言因极致性能与硬件控制力成为系统开发首选，但其“自由”伴生未定义行为（UB）：语法合法却结果不可控，是“调试正常、上线崩溃”的元凶。UB包括数组越界、有符号溢出、空指针解引用、序列点违规、重复释放等，编译器可任意优化或崩溃。规避需严守边界、开启高警告、判空置空、拆分表达式、预检溢出。（239字）

72 8 8

小攻云攻略

|

7天前

|

Serverless

|

博文

阿里云产品二月刊来啦

千问 Qwen3.5-Plus 重磅登场，百炼 Coding Plan 支持多款开闭源模型，桌面 Agent 工具 CoPaw 开源，函数计算 AgentRun 重磅上线知识库功能｜产品二月刊

232 6 7

刘大猫.

|

7天前

|

Java

|

博文

java工具：日期毫秒数转日期字符串

84 6 6

游客vv4u4wyick5ti

|

7天前

|

SQL 人工智能自然语言处理

|

博文

.md 编译了个人认知，什么来编译企业的认知？

在蚂蚁的时候，我们喊的口号是“让数据像水一样流动”，让每个念头都能被数据灌溉。现在我觉得这句话应该更新一下：让认知像代码一样流动。

72 3 3

游客hkbx5vjvfmd4q

|

7天前

|

人工智能自然语言处理数据管理

|

博文

零安装在线网站制作，为什么正在成为新主流

零安装在线网站制作将开发环境云端化，用户无需配置本地环境，打开浏览器即可完成建站、编码、数据管理与部署。依托浏览器能力提升、云基建成熟及AI生成技术，如lynxcode（原lynx AI）支持自然语言生成全栈代码，大幅降低门槛，加速原型验证与快速迭代，尤其适合创业者与非技术人员。

59 5 5

游客hkbx5vjvfmd4q

|

7天前

|

人工智能自然语言处理前端开发

|

博文

AI生成网站入门指南：从零基础到专业建站的路径

零基础建站难？AI生成网站成新选择！无需代码、低成本，三步搞定：①明确目标场景；②用自然语言生成页面与前后端代码（如LynxCode）；③优化交互与适配。AI不替代开发者，而是降低门槛、提升效率，助创业者快速验证想法。

155 3 3

来自：人工智能平台PAI 版块

Echo_Wish

|

7天前

|

API 数据库数据安全/隐私保护

|

博文

别再只会调大模型了：用 Python 搭一套自己的知识库问答系统（RAG 实战指南）

234 2 2

Echo_Wish

|

7天前

|

消息中间件监控算法

|

博文

别只盯着离线指标了：用大数据把模型“在线状态”盯死

73 2 2

Java开发者

|

8天前

|

Java 编译器 C++

|

博文

#Java 逃逸分析与栈上分配：JIT 编译的极致性能优化底层

逃逸分析是JVM核心优化技术，JDK 1.6起默认启用。它通过分析对象动态作用域，对无逃逸对象实施栈上分配、标量替换和同步消除，显著降低GC压力、提升执行效率，是高性能Java开发的必备底层知识。（239字）

64 3 3

刘大猫.

|

8天前

|

Java

|

博文

java工具：《Java Stream 实现 List 交集过滤：根据 ID 数组筛选对象集合》

84 5 5

Echo_Wish

|

9天前

|

自然语言处理调度语音技术

|

博文

一行 Python，三种世界：聊聊文本 + 图像 + 音频的多模态协同生成

91 4 4

Echo_Wish

|

9天前

|

算法搜索推荐大数据

|

博文

别再怪模型不聪明了：冷启动，本质是你“没喂饱”数据

118 2 2

py世界

|

9天前

|

数据采集

|

问答

有哪些好用的爬虫mcp，能搭建reddit数据采集agent？

53 1 0

py世界

|

9天前

|

数据采集 Python

|

问答

使用python requests采集商品数据时，总是跳出验证码怎么办？

54 1 0

winx_19970108018

|

9天前

|

缓存监控 API

|

博文

十一年实战沉淀：京东商品详情api深度解析与落地技巧

本文分享京东商品详情API实战经验，涵盖签名错误、参数不规范、限流、异常处理及接口误用等5大高频坑点及解决方案，并提供工具封装、智能缓存、批量优化与监控预警等高效落地技巧，助开发者快速稳定接入。（239字）

96 2 2

meng1900

|

9天前

|

数据采集人工智能前端开发

|

博文

一行代码，把网页变成 AI Agent

PageAgent是阿里开源的网页内智能体，纯前端，零基建，一行代码接入，支持多种模型。MIT 开源。

399 6 6

py世界

|

9天前

|

API

|

问答

selenium操作浏览器采集数据经常被拦截，可以通过亮数据api来处理嘛？

51 1 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

开启云上 AIGC 动手实践，探索技术创意

Snowflake SVA vs Aloudata CAN：两种语义层哲学的深度对比

UV实战教程，我啥要从Anaconda切换到uv来管理包？

java工具：《Java获取明日零点时间工具方法》

1688图片搜索API（拍立淘）实操指南

LitBuy反向海淘代购系统搭建指南

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

从 0 到 1 写一个神经网络训练循环：别再只会 `model.fit()` 了

从踩坑到高效落地：淘宝拍立淘图片搜索API的实操心得

SEP-YOLO：当频域分析遇上YOLO，透明物体实例分割迎来新突破，ISCAS 2026

java工具：《Java获取昨日零点时间工具方法》

PyTorch vs TensorFlow：谁才是深度学习界的“顺手兵器”？一次接地气的实战对比

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

acbuy模式反向海淘淘宝1688系统搭建经验

从踩坑到高效落地：淘宝商品详情API的实操心得

当大模型开始“碎碎念”：聊聊大模型日志分析与调优系统是怎么设计的

别只盯着模型参数了：聊聊多模态时代最容易被忽视的一件事——训练数据准备

java工具：《Java日期格式化完全指南：从Date到String的优雅转换》

AI 术语满天飞？90% 的人只懂名词，不懂为什么！

基于 Rokid 灵珠与 UXR 3.0 的 AR 智能卡路里识别系统实战

java工具：String转Long（日期格式字符串转为时间毫秒数）

不想再被 API 账单吓一跳？教你用 Python 搭一个本地大模型推理 API

AI 会写稿了，人还要不要写？——聊聊生成式 AI 在数据增强与自动写稿里的伦理和质量问题

Cnfans 反向海淘代购系统搭建经验

大模型太慢？别急着上 GPU 堆钱：Python + ONNX Runtime 优化推理性能实战指南

日志不是垃圾，是金矿：聊聊基于日志的大规模用户行为建模如何撑起推荐系统

java工具：Long转String（时间毫秒数转日期格式字符串）

Java AQS：JUC 并发体系的底层同步框架基石

Amazon竞品调价实时预警系统：OpenClaw AI Agent + Pangolinfo API 企业级落地实践

java工具：检测一个字符串是否是时间格式

从提取式API到隧道代理：提升爬虫稳定性的5个核心秘籍

LitBuy模式反向海淘系统（欧美淘宝/1688代购）搭建指南

阐述：关键词搜索京东商品列表API接口

C语言深度解析：未定义行为（UB）—— 90%玄学bug的根源

阿里云产品二月刊来啦

java工具：日期毫秒数转日期字符串

.md 编译了个人认知，什么来编译企业的认知？

零安装在线网站制作，为什么正在成为新主流

AI生成网站入门指南：从零基础到专业建站的路径

别再只会调大模型了：用 Python 搭一套自己的知识库问答系统（RAG 实战指南）

别只盯着离线指标了：用大数据把模型“在线状态”盯死

#Java 逃逸分析与栈上分配：JIT 编译的极致性能优化底层

java工具：《Java Stream 实现 List 交集过滤：根据 ID 数组筛选对象集合》

一行 Python，三种世界：聊聊文本 + 图像 + 音频的多模态协同生成

别再怪模型不聪明了：冷启动，本质是你“没喂饱”数据

有哪些好用的爬虫mcp，能搭建reddit数据采集agent？

使用python requests采集商品数据时，总是跳出验证码怎么办？

十一年实战沉淀：京东商品详情api深度解析与落地技巧

一行代码，把网页变成 AI Agent

selenium操作浏览器采集数据经常被拦截，可以通过亮数据api来处理嘛？

大数据与机器学习

活跃用户

相关产品