大数据与机器学习-最热-第14页-阿里云开发者社区

游客vv4u4wyick5ti

|

4月前

|

SQL 人工智能 BI

|

博文

Gartner：40% 的 AI Agent 项目注定被砍

造 Agent 越来越容易，但壁垒不在模型，在数据语义层。养虾热闹，虾能不能活取决于水质。

297 1 2

Echo_Wish

|

4月前

|

分布式计算 Kubernetes Spark

|

博文

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

480 7 7

winx_19970108018

|

4月前

|

监控数据挖掘 API

|

博文

从踩坑到高效落地：淘宝商品详情API的实操心得

淘宝商品详情API提供全维度商品数据，含基础信息、详情页HTML、SKU、价格、销量等，支持比价、代购、数据分析及内容电商等场景，涵盖item.get、item.get_pro等核心接口，接入便捷高效。

530 4 5

奔跑的数据

|

4月前

|

数据采集网络协议 API

|

博文

从提取式API到隧道代理：提升爬虫稳定性的5个核心秘籍

本文讨论了五个关键细节以优化爬虫代理使用：使用隧道代理、合理设置超时、利用连接池、引入重试机制、伪装请求头。通过隧道代理的实战代码示例，展示了如何实现这些优化，以提高爬虫的稳定性和效率。

479 2 2

狸奴算君

|

5月前

|

人工智能自然语言处理小程序

|

博文

给AI拜年差点翻车后，我悟了：RAG和微调，到底谁更懂“人情世故”？

大家好，我是AI伙伴狸猫算君！本文以“AI写春节祝福”为切入点，深入剖析RAG与微调的技术差异：RAG依赖检索拼凑，难捕获独特人情；微调则通过高质量关系感知数据，将“称呼、细节、风格”内化为模型本能。手把手演示30分钟用LLaMA-Factory完成Qwen3微调，让祝福真正有温度、有梗、有你。

386 13 13

1隔壁老陈

|

5月前

|

人工智能自然语言处理架构师

|

博文

AI Agent 职业路线全指南：从智能体普及浪潮到分层能力构建

2026年，“AI+”进入产业级落地期，智能体成为数字化转型核心基础设施。全球市场规模达2.3万亿，我国2027年普及率将超70%。人才缺口巨大，教育部已设“智能体技术应用”新专业。本文系统梳理四类职业路径（管理者、架构师、多智能体专家、垂直领域专家）及企业治理框架，助力职场人锚定定位、实战进阶。（239字）

933 2 3

小小张说故事

|

5月前

|

数据可视化数据挖掘 API

|

博文

Matplotlib 入门指南：让数据"开口说话"的魔法库

本教程系统讲解Matplotlib数据可视化：从环境搭建、核心概念（Figure/Axes/Artist）到实战分析电影评分趋势；涵盖中文字体配置、常见陷阱规避及最佳实践，并指引Seaborn、Plotly等进阶方向，助你高效掌握Python可视化核心技能。（239字）

706 9 9

winx_19970108018

|

5月前

|

数据采集人工智能监控

|

博文

天猫商品详情API全解析

天猫商品详情API是淘宝开放平台提供的官方接口，合规、高效获取天猫商品全量结构化数据（价格、销量、规格等），支持精准筛选与实时同步，助力选品决策、竞品分析与智能运营，规避爬虫风险。（239字）

432 1 1

狸奴算君

|

6月前

|

人工智能安全物联网

|

博文

告别数据泄露：三步构建企业级AI的隐私保护盾

企业微调大模型面临数据不出域与合规强监管的双重挑战。本文详解差分隐私（加噪声）、联邦学习（数据不动模型动）和LoRA（仅调0.1%参数）三重防护技术，覆盖脱敏、训练、部署全链路，并提供可运行代码与ε值选型指南，助你安全打造专属AI。（239字）

704 1 1

Echo_Wish

|

6月前

|

机器学习/深度学习搜索推荐算法

|

博文

推荐系统为啥都长一个样？聊聊「离线训练 + 在线召回 + 排序」这套大数据架构

427 0 0

游客vv4u4wyick5ti

|

6月前

|

存储 SQL 人工智能

|

博文

数据语义层 vs 宽表模式：哪种架构更适合 AI 时代的数据分析？

用户零等待指标交付，逻辑变更分钟级生效，无需 ETL；100%一致口径，所有人与 AI 通过同一语义层访问数据；无缝对接 AI，语义层为 AI 提供标准化查询 API。

698 1 1

Calvad0s

|

6月前

|

人工智能

|

博文

大模型产生幻觉的原因，如何解决？

大模型“幻觉”指AI生成看似合理但错误或虚构的信息，源于其概率预测机制、训练数据缺陷及缺乏事实核查能力。可通过RAG、微调、联网检索、自我核查等方法降低幻觉风险，提升输出准确性与可靠性。（238字）

1979 3 3

Echo_Wish

|

6月前

|

消息中间件 JSON Kafka

|

博文

“字段多一个，凌晨三点炸一次”：聊聊流数据里的 Schema 演化，到底该怎么扛

303 10 10

游客fjfnvw6coc64q

|

7月前

|

人工智能缓存自然语言处理

|

博文

大模型推理与应用术语解释

简介：大语言模型核心技术涵盖推理、生成式AI、检索增强生成（RAG）、提示工程、上下文学习、代理、多模态学习与语义搜索。这些技术共同推动AI在内容生成、知识检索、智能决策和跨模态理解等方面的能力跃升，广泛应用于问答系统、创作辅助、企业服务与自动化任务，正重塑人机交互与信息处理范式。（238字）

248 0 0

Echo_Wish

|

7月前

|

SQL 分布式计算运维

|

博文

一套平台养百家客户？多租户数据平台不是“分库分表”这么简单

450 6 6

winx_19970108018

|

7月前

|

JSON 监控 API

|

博文

京东商品列表 API使用指南

京东商品列表API是京东开放平台提供的核心接口，支持按关键词、分类、价格、销量等条件筛选商品，返回标题、价格、库存、销量等结构化信息，适用于店铺管理、价格监控、竞品分析等场景。需认证开发者身份并获取appkey、access_token及相应权限后调用，接口以JSON格式传输，部分按量计费。

428 2 2

winx_19970108018

|

7月前

|

机器学习/深度学习 JSON API

|

博文

1688图片识别商品接口API使用指南

1688图片识别商品API基于深度学习技术，支持上传图片或URL，精准识别1688平台商品信息，涵盖标题、链接、价格、供应商等。适用于批发采购、货源匹配等场景，具备高精度、低延迟、强兼容特性，支持主流图片格式，遵循RESTful规范，助力开发者高效对接1688商品生态。

519 1 1

Echo_Wish

|

7月前

|

消息中间件分布式计算 Kafka

|

博文

别再全量拉表了兄弟：一篇讲透增量数据处理与 CDC 的实战指南

367 9 9

ChenAI_TGF

|

7月前

|

人工智能运维监控

|

博文

开源项目分享：Gitee热榜项目 2025年12月第二周周榜

本文档汇总Gitee本周热门开源项目，涵盖Fay、JeeLowCode等明星项目，结合AI与低代码趋势，深入分析技术融合与场景创新，助力开发者把握前沿动态。

760 2 2

ChenAI_TGF

|

7月前

|

存储 Linux 数据处理

|

博文

实用程序：基于Python+Tkinter开发表格比对&整理工具

一款基于Python+Tkinter开发的免费开源Excel处理工具，支持表格差异比对与错乱行整理，完整保留图片，兼容.xlsx和.csv格式。操作简单，支持自定义比对列、多线程处理，解决日常办公中数据比对、行合并及图片丢失等痛点，适用于各类Excel数据清理场景。（239字）

622 12 12

游客762zd6bkezdcs

|

7月前

|

人工智能智能设计算法

|

博文

2026 GEO生成搜索优化技术白皮书：章节详解与案例深度分析

周有贵，GEO专家，深耕AI时代流量入口变革，倡导从SEO到GEO（生成式引擎优化）的认知重构，聚焦“被发现-被理解-被推荐”三层框架，推动企业通过结构化内容、信任资产与平台适配，实现AI信源卡位。

1816 2 3

1623789125455094

|

7月前

|

API 开发者

|

博文

增值税发票查验接口状态码说明-发票识别验真API

增值税发票验真是企业财税数字化的关键，通过API可实时核验发票真伪及状态（如正常、作废、红冲等）。本文详解查验接口的调用参数、返回示例及各类状态码含义，涵盖专票、普票、电子票等多种类型，助力开发者高效集成，提升系统稳定性和税务合规性。

547 2 3

winx_19970108018

|

8月前

|

JSON API 数据格式

|

博文

小红书笔记详情API秘籍！轻松获取笔记数据

小红书笔记详情API是开放平台核心接口，用于获取指定笔记的标题、正文、互动数据及多媒体资源，支持内容分析与营销优化。2025年6月起启用v4版，新增视频解析与实时数据推送。需note_id和access_token参数，返回JSON格式数据。

972 5 5

Echo_Wish

|

8月前

|

自然语言处理搜索推荐算法

|

博文

别再给我推明星八卦了！——大数据视角下，个性化新闻推荐的“人间真实”优化指南

623 11 11

winx_19970108018

|

8月前

|

数据采集 JSON API

|

博文

京东工业平台商品详情API

京东工业平台商品详情API基于HTTPS和JSON，提供商品基础信息、SKU规格及批量查询功能，支持分钟级价格库存更新。开发者需注册企业账号并完成签名认证，单次请求可获取最多20个SKU数据，高效便捷，适用于工业品电商集成与数据同步场景。

364 44 45

winx_19970108018

|

8月前

|

JSON 监控供应链

|

博文

天猫商品详情API技术文档：智能电商开发的必备工具

天猫商品详情API（tmall.item_get）通过商品ID实时获取标题、价格、库存、SKU、评价等结构化数据，支持JSON格式返回，适用于电商分析、竞品监控与价格优化，需授权访问，可按需筛选字段，提升数据传输效率。

462 3 3

灵杰开发者

|

9月前

|

存储分布式计算运维

|

博文

云栖实录｜驰骋在数据洪流上：Flink+Hologres驱动零跑科技实时计算的应用与实践

零跑科技基于Flink构建一体化实时计算平台，应对智能网联汽车海量数据挑战。从车机信号实时分析到故障诊断，实现分钟级向秒级跃迁，提升性能3-5倍，降低存储成本。通过Flink+Hologres+MaxCompute技术栈，打造高效、稳定、可扩展的实时数仓，支撑100万台量产车背后的数据驱动决策，并迈向流批一体与AI融合的未来架构。

695 3 3

来自：实时计算 Flink 版块

灵杰开发者

|

9月前

|

存储物联网 Serverless

|

博文

理想汽车基于 Hologres + Flink 构建万亿级车联网信号实时分析平台

理想汽车携手阿里云Hologres+Flink，打造万亿级车联网实时分析平台。面对百万余辆智能车、每秒百万级信号上报的挑战，通过存算分离、冷热分层、流批一体等创新，实现写入性能提升200%、查询QPS超万、成本降低40%，支撑数字孪生、智能诊断等高实时业务，构建高可用、弹性伸缩、低成本的下一代数据底座。

860 4 4

八进智

|

9月前

|

Kubernetes Go 调度

|

博文

Kubeflow-Trainer-架构学习指南

本指南系统解析Kubeflow Trainer架构，涵盖核心设计、目录结构与代码逻辑，结合学习路径与实战建议，助你掌握这一Kubernetes原生机器学习训练平台的原理与应用。

985 139 139

啦啦啦191

|

10月前

|

安全数据安全/隐私保护 Windows

|

博文

ZyperWin++使用教程！让Windows更丝滑！c盘飘红一键搞定！ZyperWin++解决系统优化、Office安装和系统激活

ZyperWin++是一款仅5MB的开源免费Windows优化工具，支持快速优化、自定义设置与垃圾清理，兼具系统加速、隐私保护、Office安装等功能，轻便无广告，小白也能轻松上手，是提升电脑性能的全能管家。

2605 0 0

硅基脂肪论

|

10月前

|

存储人工智能搜索推荐

|

博文

终身学习型智能体

当前人工智能前沿研究的一个重要方向：构建能够自主学习、调用工具、积累经验的小型智能体（Agent）。我们可以称这种系统为“终身学习型智能体”或“自适应认知代理”。它的设计理念就是：不靠庞大的内置知识取胜，而是依靠高效的推理能力 + 动态获取知识的能力 + 经验积累机制。

1420 135 139

delacroix_xu-15509

|

10月前

|

数据采集机器学习/深度学习人工智能

|

博文

YOLOv11浅浅解析：架构创新

YOLOv11是YOLO系列最新升级版，通过C3k2模块、SPPF优化和解耦检测头等创新，显著提升检测精度与速度，mAP提高2-5%，推理更快，支持多平台部署，适用于工业、安防、自动驾驶等场景。

2045 1 3

灵杰开发者

|

10月前

|

人工智能自然语言处理搜索推荐

|

博文

AI搜索的黑科技？DeepSearch 究竟“深”藏着什么秘密？

本文介绍 OpenSearch 凭借领先的AI搜索技术，应用DeepSearch 的设计框架能更有效解决复杂和多跳问题，优化用户体验。

1382 0 0

来自：智能搜索推荐版块

winx_19970108018

|

10月前

|

算法 API 数据安全/隐私保护

|

博文

深度解析京东图片搜索API：从图像识别到商品匹配的算法实践

京东图片搜索API基于图像识别技术，支持通过上传图片或图片URL搜索相似商品，提供智能匹配、结果筛选、分页查询等功能。适用于比价、竞品分析、推荐系统等场景。支持Python等开发语言，提供详细请求示例与文档。

891 5 5

Echo_Wish

|

10月前

|

程序员区块链 vr&ar

|

博文

当VR遇上区块链：聊聊数字身份管理的新玩法

1434 6 6

奔跑的数据

|

11月前

|

数据采集存储前端开发

|

博文

学术数据采集中的两条路径：结构化提取与交互式解析

在科研信息采集过程中，自动化获取论文元数据（如标题、作者、引用等）已成为刚需。本文以 Scopus 和 CNKI 为例，详解两种主流抓取方式：一是直接解析 HTML 获取浅层数据，二是通过模拟交互提取深层内容，并结合代理服务绕过访问限制，实现高效稳定的数据采集。

610 0 0

null_is_null

|

11月前

|

监控 Linux iOS开发

|

博文

PyCharm启动项目和调试项目

本文介绍了在 PyCharm 中启动和调试 Python 项目的详细步骤，涵盖单文件运行、配置管理、命令行工具使用、断点调试、变量监控、远程调试及常见问题解决方案，帮助开发者高效利用 PyCharm 的调试功能提升开发效率。

2356 4 4

来自：人工智能平台PAI 版块

探索云世界

|

11月前

|

数据采集人工智能分布式计算

|

博文

训练效率提升100%！阿里云后训练全栈解决方案发布实录

阿里云大数据AI平台推出大模型后训练解决方案，通过全栈AI能力提供从算力到平台的一体化支撑，提升训练效率100%，适配多行业需求，打通大模型落地“最后一公里”。

871 0 0

Deephub

|

11月前

|

JSON 算法数据库

|

博文

使用 BAML 模糊解析改进 LangChain 知识图谱提取：成功率从25%提升到99%

在构建基于知识图谱的检索增强生成（RAG）系统时，从非结构化数据中准确提取节点和关系是一大挑战，尤其在使用小型本地量化模型时表现更差。本文对比了传统 LangChain 提取框架的严格 JSON 解析限制，提出采用 BAML 的模糊解析策略，显著提升知识图谱提取成功率。实验表明，在相同条件下，BAML 将成功率从约 25% 提升至 99% 以上，为构建高效、稳定的 RAG 系统提供了有效解决方案。

451 0 0

魔羯座liaotianfeile

|

12月前

|

JSON Java API

|

博文

如何获取sku详情信息

`item_sku`接口用于获取商品的SKU详细信息，支持通过商品ID和SKU ID查询。提供公共参数及请求参数说明，并包含请求和响应示例。支持多种开发语言，如Curl、PHP、JAVA等，适用于电商应用开发。

740 0 0

V哥AI增长

|

21天前

|

人工智能搜索推荐数据库

|

博文

3个技术特征：向量数据库如何驱动AI搜索引擎的内容引用选择

本文从技术角度解析AI搜索引擎（如豆包、Kimi、DeepSeek）的内容引用机制，揭示其依赖向量数据库进行语义检索的本质。基于2026年实测数据，指出内容被引用的三大关键指标：结构化层级清晰度、数据密度、权威来源可追溯性，并阐明其与传统关键词检索的根本差异。（239字）

106 1 1

来自：智能搜索推荐版块

Echo_Wish

|

23天前

|

SQL 消息中间件缓存

|

博文

大屏做得越炫越好？错！数据实时性和展示性能，才是真正决定项目成败的关键

172 2 2

游客j5xt5y4p6is2u

|

26天前

|

存储 SQL 数据可视化

|

博文

基于阿里云IoT平台的Cat.1电表工厂用电监测方案实践

本文介绍阿里云IoT方案解决工厂用电管理“盲区”：通过Cat.1电表+IoT平台实现分钟级异常用电告警，Lindorm存储46维时序数据，函数计算执行恶性负载检测，DataV可视化分租户独立计费，电费纠纷下降87%。（239字）

136 1 1

Echo_Wish

|

27天前

|

运维监控数据可视化

|

博文

别再盯着折线图了！趋势分析与异常检测，真正厉害的人都这样做可视化

192 2 2

1412813596264204

|

28天前

|

弹性计算人工智能 NoSQL

|

博文

ECS 上给 Coding Agent 准备可复现环境

本文介绍在ECS上为Coding Agent定制的标准化开发环境：通过Docker Compose+健康检查、固定Node/DB/Redis镜像、预置环境变量与统一脚本，解决本地环境差异导致的测试失败、依赖未就绪等问题，确保Agent开箱即用、稳定执行lint、测试与开发任务。（239字）

132 0 0

QuickBI运营小助手

|

1月前

|

前端开发 BI 数据处理

|

博文

财通证券 x Quick BI：传统业务数字化升级，沉淀300+营销目标场景

财通证券携手瓴羊构建数据中台，打通多系统“数据孤岛”，打造300+市场标签，依托Quick BI实现零代码分析与智能营销，推动APP用户占比从15%跃升至50%，实现数据驱动的精细化运营与组织升级。

147 0 0

QuickBI运营小助手

|

1月前

|

人工智能算法数据可视化

|

博文

海亮集团 x Quick BI：数据驱动“看到-知道-做到”，打造集团级智能决策中枢

海亮集团携手Quick BI打造“海亮大脑”，实现人资、营销、仓储三大场景数据智能升级：人岗匹配率提升20%，营销响应提速90%，库存成本下降18%。数据准确率达98%，消费超190万次。

187 0 0

奔跑的数据

|

1月前

|

数据采集前端开发 JavaScript

|

博文

别只盯着HTML了！教你高效抓取并解析PDF/Excel隐藏附件？

本文聚焦网页附件（PDF/Excel）爬取痛点，系统讲解隐藏链接识别、二进制文件下载、pdfplumber/pandas精准解析及代理IP轮换反爬策略，并附完整实战代码，助你高效获取高价值结构化数据。（239字）

310 0 0

游客vv4u4wyick5ti

|

1月前

|

人工智能 BI API

|

博文

Data Fabric vs 数据中台：企业数据整合架构正在发生什么变化

它天然更适合 AI 时代的数据使用方式，因为 AI 并不只需要一个集中仓库，而更需要跨源、可解释、可调用的数据上下文。

121 0 0

卿云阁

|

1月前

|

机器学习/深度学习编解码算法

|

博文

PyTorch深度学习实战 |手算U-net

本文详细解析了U-Net网络架构及其在医学图像分割中的应用。重点对比了U-Net与FCN的核心区别：U-Net采用特征拼接(Concat)保留所有层级信息，而FCN使用特征相加(Add)进行融合。文章深入剖析了U-Net的编码器-瓶颈-解码器结构，解释了其独特的裁剪拼接机制和Overlap-tile策略，并提供了完整的PyTorch实现代码。现代U-Net通过SamePadding实现了输入输出尺寸一致，显著提升了分割精度。文章还探讨了弹性形变数据增强和带空间权重的损失函数设计，为医学图像分析提供了实用解决

211 2 3

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

Gartner：40% 的 AI Agent 项目注定被砍

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

从踩坑到高效落地：淘宝商品详情API的实操心得

从提取式API到隧道代理：提升爬虫稳定性的5个核心秘籍

给AI拜年差点翻车后，我悟了：RAG和微调，到底谁更懂“人情世故”？

AI Agent 职业路线全指南：从智能体普及浪潮到分层能力构建

Matplotlib 入门指南：让数据"开口说话"的魔法库

天猫商品详情API全解析

告别数据泄露：三步构建企业级AI的隐私保护盾

推荐系统为啥都长一个样？聊聊「离线训练 + 在线召回 + 排序」这套大数据架构

数据语义层 vs 宽表模式：哪种架构更适合 AI 时代的数据分析？

大模型产生幻觉的原因，如何解决？

“字段多一个，凌晨三点炸一次”：聊聊流数据里的 Schema 演化，到底该怎么扛

大模型推理与应用术语解释

一套平台养百家客户？多租户数据平台不是“分库分表”这么简单

京东商品列表 API使用指南

1688图片识别商品接口API使用指南

别再全量拉表了兄弟：一篇讲透增量数据处理与 CDC 的实战指南

开源项目分享：Gitee热榜项目 2025年12月第二周 周榜

实用程序：基于Python+Tkinter开发表格比对&整理工具

2026 GEO生成搜索优化技术白皮书：章节详解与案例深度分析

增值税发票查验接口状态码说明-发票识别验真API

小红书笔记详情API秘籍！轻松获取笔记数据

别再给我推明星八卦了！——大数据视角下，个性化新闻推荐的“人间真实”优化指南

京东工业平台商品详情API

天猫商品详情API技术文档：智能电商开发的必备工具

云栖实录｜驰骋在数据洪流上：Flink+Hologres驱动零跑科技实时计算的应用与实践

理想汽车基于 Hologres + Flink 构建万亿级车联网信号实时分析平台

Kubeflow-Trainer-架构学习指南

ZyperWin++使用教程！让Windows更丝滑！c盘飘红一键搞定！ZyperWin++解决系统优化、Office安装和系统激活

终身学习型智能体

YOLOv11浅浅解析：架构创新

AI搜索的黑科技？DeepSearch 究竟“深”藏着什么秘密？

深度解析京东图片搜索API：从图像识别到商品匹配的算法实践

当VR遇上区块链：聊聊数字身份管理的新玩法

学术数据采集中的两条路径：结构化提取与交互式解析

PyCharm启动项目和调试项目

训练效率提升100%！阿里云后训练全栈解决方案发布实录

使用 BAML 模糊解析改进 LangChain 知识图谱提取：成功率从25%提升到99%

如何获取sku详情信息

3个技术特征：向量数据库如何驱动AI搜索引擎的内容引用选择

大屏做得越炫越好？错！数据实时性和展示性能，才是真正决定项目成败的关键

基于阿里云IoT平台的Cat.1电表工厂用电监测方案实践

别再盯着折线图了！趋势分析与异常检测，真正厉害的人都这样做可视化

ECS 上给 Coding Agent 准备可复现环境

财通证券 x Quick BI：传统业务数字化升级，沉淀300+营销目标场景

海亮集团 x Quick BI：数据驱动“看到-知道-做到”，打造集团级智能决策中枢

别只盯着HTML了！教你高效抓取并解析PDF/Excel隐藏附件？

Data Fabric vs 数据中台：企业数据整合架构正在发生什么变化

PyTorch深度学习实战 |手算​​U-net

大数据与机器学习

活跃用户

相关产品

开源项目分享：Gitee热榜项目 2025年12月第二周周榜

PyTorch深度学习实战 |手算U-net