大数据与机器学习-最热-第12页-阿里云开发者社区

Deephub

|

11月前

|

人工智能监控算法

|

博文

构建时序感知的智能RAG系统：让AI自动处理动态数据并实时更新知识库

本文系统构建了一个基于时序管理的智能体架构，旨在应对动态知识库（如财务报告、技术文档）在问答任务中的演进与不确定性。通过六层设计（语义分块、原子事实提取、实体解析、时序失效处理、知识图构建、优化知识库），实现了从原始文档到结构化、时间感知知识库的转化。该架构支持RAG和多智能体系统，提升了推理逻辑性与准确性，并通过LangGraph实现自动化工作流，强化了对持续更新信息的处理能力。

1406 5 5

奔跑的数据

|

11月前

|

数据采集存储关系型数据库

|

博文

全量抓取还是增量采集？二手房数据采集实战解析

本文以链家二手房数据采集为例，探讨全量抓取与增量采集的优劣与适用场景，并结合代理IP技术实现高效、稳定的爬虫方案。通过SQLite/PostgreSQL存储、内容哈希去重、定时任务调度等手段，构建可持续运行的数据更新与统计系统。适用于房产数据分析、市场监测等场景，兼顾资源效率与数据质量。

683 0 0

游客vv4u4wyick5ti

|

26天前

|

SQL 人工智能 BI

|

博文

正当红的 Context Layer 到底是什么？

给 AI 更多上下文并不是目的，让 AI 在更小、更可信的范围里把事情做对，才是。

145 0 0

游客tg2jszfthwlu2

|

1月前

|

数据采集存储人工智能

|

博文

AI搜索重构制造业采购逻辑：基于阿里云的企业级GEOCMS优化实践

福建制造企业官网内容多为PDF/图片，AI无法识别，导致“隐形”。本文提出基于阿里云的GEO（生成式引擎优化）方案，含结构化建模、向量知识库、AI引用监测、llms.txt引导四大引擎，助力企业从“人类可读”升级为“AI可理解”，抢占AI搜索新流量。

243 0 0

来自：智能搜索推荐版块

QuickBI运营小助手

|

1月前

|

人工智能供应链搜索推荐

|

博文

伽蓝 x Quick BI：美妆竞争加剧，伽蓝“数”驱增长

本文以伽蓝集团数字化转型为案例，展现其如何通过数据中台、“一盘货”体系及AI模型（如人货匹配、高潜复购），实现营收增长、效率跃升与精准营销。2022年逆势增长2.6%，数字化营收占比达98.8%。

186 0 0

QuickBI运营小助手

|

1月前

|

供应链数据可视化新能源

|

博文

极氪 x Quick BI：3年登录纽交所，数字化“原住民”的秘密武器是什么？

极氪借助瓴羊Quick BI打造“极数BI”数据中台，打通研产供销服全链路，高管活跃率超60%。实现OTD全流程可视化、产销协同端到端贯通，支撑DTC模式高效决策。

197 6 6

QuickBI运营小助手

|

1月前

|

数据采集人工智能数据可视化

|

博文

圣迪乐 x Quick BI：一枚AI 鸡蛋打破农牧数字化困局，五年营收增长300%

圣迪乐通过瓴羊Quick BI实现全链路数字化：养殖人效提升12倍、数据分析效率提升80%、五年营收增长超300%。打通饲料、养殖、加工、流通数据，支持T+1决策，400+报表赋能一线。

157 0 0

爱专研的技术土狗

|

1月前

|

运维安全 Java

|

博文

接口添加白名单 IP 地址的作用与价值

本文系统阐述IP白名单机制在API安全防护中的核心价值：通过“默认拒绝、显式授权”策略，从安全、性能、合规等维度筑牢防线——防未授权访问、减服务器压力、满足等保/PCI DSS等合规要求，并支持多层级部署与Java/Nginx快速落地，是API安全体系中最基础、经济且高效的第一道屏障。（239字）

173 1 1

pai_rec_coder

|

1月前

|

机器学习/深度学习人工智能网络架构

|

博文

深度解析：Transformer 的“灵魂”——QKV 变换的物理直觉

本文用图书馆检索等生活隐喻，从物理意义与认知科学角度解析Transformer中QKV设计的精妙本质：解耦查询（q）、键（k）、值（v）三重角色，实现语义分离、避免自注意力“自恋”，模拟人类动态信息路由的认知过程。（239字）

463 13 13

来自：人工智能平台PAI 版块

卿云阁

|

1月前

|

机器学习/深度学习人工智能编解码

|

博文

人工智能|大白话YOLOv3,YOLOv4

YOLOv3采用全卷积+残差连接+多尺度融合架构，含Darknet-53骨干网、FPN颈部与三尺度检测头，支持任意32倍数输入（如416×416），输出13×13、26×26、52×52特征图，兼顾大中小目标检测。

223 2 2

游客kxwloxiunt6vy

|

3月前

|

云安全弹性计算安全

|

博文

从理论到实践：在阿里云ECS上部署国密SM4加密U盘管控系统

2025年某科技企业因U盘遗失致核心代码泄露，暴露离线介质管控短板。本文剖析国密SM4/SM3算法在U盘透明加密中的关键作用，结合阿里云ECS可信环境、KMS国密密钥托管及云安全中心联动能力，提供“带不走、打不开、可追溯”的全链路防护方案，兼顾安全、可用与合规。（239字）

679 3 3

游客nz57hopezd4hg

|

3月前

|

人工智能数据可视化 JavaScript

|

博文

剪视频不用再开 PR 的 AI 工作流

本文对比OpenClaw三种部署方式（本地、全托管、阿里云轻量自托管），重点推荐后者：兼顾7×24在线、数据自主、灵活扩展与开箱即用。结合真实视频剪辑场景，详解字幕生成、批量处理、竖屏裁切等高效AI功能，适合Vlog/知识类博主提效减负。

472 0 0

爱专研的技术土狗

|

3月前

|

数据采集 JSON API

|

博文

1688包装信息API接口完全指南（2026版）

本文详解1688商品包装信息获取方案：官方API（alibaba.product.get）字段分散，仅含基础重量/尺寸；推荐使用AliPrice等第三方聚合API，可直接获取净重、毛重、包装方式、内外箱尺寸、装箱数等完整结构化数据，并附Python双通道实战代码与物流计费逻辑。

1170 0 0

阿里云大数据

|

3月前

|

存储算法定位技术

|

博文

一套底座支撑多场景：高德地图基于 Paimon + StarRocks 轨迹服务实践

面对轨迹数据“高实时、高并发、长周期存储”的典型特征，高德团队以访问跨度为依据完成热/温/冷分层，并以 Apache Paimon + StarRocks 构建统一的数据底座，支撑轨迹数据的近实时写入与高性能查询。

555 4 4

来自：开源大数据平台 E-MapReduce 版块

游客avsawnkvmmxp6

|

4月前

|

机器学习/深度学习 SQL 人工智能

|

博文

自然语言查数技术路线对比：本体神经网络如何实现企业级精准问数

本文剖析NL2SQL、RAG、预制指标与本体神经网络四大技术路线，指出后者（Palantir、UINO采用）以ABC范式实现高准确率（95%+）、线性维护成本、跨库多模态精准问数，真正支撑企业级智能分析。

481 1 1

AI小怪兽

|

4月前

|

机器学习/深度学习人工智能算法

|

博文

SEP-YOLO：当频域分析遇上YOLO，透明物体实例分割迎来新突破，ISCAS 2026

本文提出SEP-YOLO框架，首创频域细节增强模块（可学习复数权重强化高频边界）、多尺度空间细化流（内容感知对齐+门控细化），并为Trans10K提供首个高质量实例标注。在Trans10K/GVD上mAP50超SOTA 3%+，兼顾精度与实时性。

446 5 6

Echo_Wish

|

4月前

|

人工智能监控 Kubernetes

|

博文

京东商品详情API是京东开放平台核心接口，合规、实时（延迟≤30秒）、全量获取商品结构化数据，涵盖价格、库存、图文、参数、评价等维度，支持高并发与企业级配额，广泛应用于比价监控、选品分析、ERP集成及营销推荐等场景。

630 2 2

狸奴算君

|

5月前

|

数据采集人工智能数据可视化

|

博文

从群发文案到私人定制：手把手教你微调一个懂人情世故的拜年助手

本文揭秘如何用微调技术让AI写出“专属感”祝福语：拆解人情世故为6个可量化要素，人工打磨3000条高质量种子数据，30分钟即让Qwen3学会“看人下菜碟”。结果不再是千篇一律的群发模板，而是带共同记忆、有温度的真挚表达——技术不止提效，更可传递心意。（239字）

407 8 8

大模型玩家七七

|

5月前

|

存储并行计算监控

|

博文

batch size、sequence length 对显存的非线性影响

本文揭示大模型训练OOM的根源：batch size与sequence length并非独立线性因子，而是以乘法甚至平方（如attention的O(L²)）方式非线性放大中间态显存。显存不是“用完”，而是被临界点“触发”崩溃。工程调优应优先关注单样本“重量”（length），而非盲目试探batch。

484 12 12

狸奴算君

|

5月前

|

人工智能 JSON 自然语言处理

|

博文

想让大模型更懂你？从原理到实践，详解高效微调的全流程

本文深入解析大模型微调中的核心参数调优与显存优化策略，涵盖学习率、训练轮数、批量大小、截断长度、LoRA秩五大关键参数的原理、调参技巧及显存影响，并结合LLaMA-Factory实战演示高效微调全流程，助你低成本、高质地打造专属AI助手。（239字）

677 1 1

狸奴算君

|

5月前

|

数据采集人工智能监控

|

博文

让大模型“开小灶”：手把手教你打造能聊业务的专属AI

本文深入浅出解析AI微调（Fine-tuning）技术：揭示通用大模型“懂常识却不懂行”的根源，详解LoRA等高效微调原理，对比RAG适用场景，并提供数据准备、LoRA训练、效果评估到部署的四步实践指南。助力业务人员低成本打造专属行业AI助手。（239字）

569 1 1

狸奴算君

|

6月前

|

SQL 人工智能安全

|

博文

手把手教你调出“懂你”的AI：大模型微调实战与资源管理

本文深入浅出讲解大模型微调核心知识：用生活化比喻解析学习率、训练轮数、批量大小、截断长度和LoRA秩五大关键参数；提供适配不同显存的实操配置表；分享Liger Kernel、DeepSpeed等省显存技巧；并强调定量、定性与效率三维评估。零基础也能快速上手定制专属AI。

718 11 11

狸奴算君

|

6月前

|

存储人工智能关系型数据库

|

博文

传统数据库与向量数据库：一个管“是什么”，一个管“像什么”

向量数据库是AI时代的语义检索引擎，将文本、图片等非结构化数据转化为“语义向量”，支持基于相似性的毫秒级搜索。它不替代MySQL等传统数据库，而是作为大模型的“海马体”，赋能RAG、智能问答与多模态应用，实现从“关键词匹配”到“理解含义”的跃迁。（239字）

1068 7 7

winx_19970108018

|

6月前

|

JSON 监控 API

|

博文

关键词搜索淘宝商品列表API指南

本API提供合规、高效的淘宝商品关键词搜索服务，支持价格/销量/店铺类型等多维筛选，实时同步价格与销量（延迟<5分钟），返回含标题、主图、SKU等全字段JSON数据，适配选品、比价、运营等场景。（239字）

392 5 5

winx_19970108018

|

6月前

|

机器学习/深度学习供应链监控

|

博文

淘宝图片搜索API（taobao.item_search_img）

淘宝图片搜索API是阿里基于深度学习的视觉检索服务，支持以图搜同款/相似商品，毫秒级响应、高准确率。提供商品、交易、店铺等结构化数据，适配选品、同款监控、智能上架等场景，合规高效，助力电商数字化升级。（239字）

829 7 7

py世界

|

6月前

|

问答

【赵渝强老师】基于Hudi的大数据湖仓一体架构

Apache Hudi（Hadoop Upserts Delete and Incremental）是开源的流式数据湖平台，支持事务、高效upsert/delete、增量处理、多引擎SQL读写（Spark/Flink/Trino等），自动管理小文件与压缩，兼容云存储，助力构建湖仓一体架构。

974 3 3

Echo_Wish

|

6月前

|

量子技术芯片异构计算

|

博文

量子芯片为什么这么难造？从“画电路”到“跑量子态”，中间全是坑

588 3 3

断箭42

|

6月前

|

人工智能缓存算法

|

博文

【AI大模型面试宝典九】- 推理部署篇

【AI大模型面试宝典】聚焦推理加速核心技术：KV-Cache优化、连续批处理、投机解码、模型并行等，结合vLLM实战与面试高频题解析，帮你系统掌握得分要点，高效斩获offer！点赞关注，持续更新中～

846 0 0

来自：人工智能平台PAI 版块

游客6aafr7mks52p4

|

7月前

|

前端开发 Java 数据库

|

博文

低代码技术架构

后端采用Spring Boot + Spring Cloud Alibaba微服务架构，Java 8+/17，Maven管理，集成MybatisPlus、Shiro+Jwt、Redis、Druid、Nacos等；前端基于Vue3.0 + TypeScript + Vite5 + Ant-Design-Vue4，支持权限控制、动态菜单等，需Node 20环境。

198 0 0

游客7km4snizezcsg

|

7月前

|

XML 算法安全

|

博文

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合，提升大模型在企业场景的准确性与安全性。分块策略是其核心，直接影响检索效果与回答质量。本文系统解析五种主流分块方法：固定大小、语义、递归、基于文档结构及LLM分块，对比其优缺点与适用场景，并提出组合优化路径，助力构建高效、可信的RAG系统。

664 0 0

刻舟未必求剑

|

7月前

|

数据采集人工智能

|

问答

660 1 0

赵渝强老师

|

8月前

|

数据采集运维 DataWorks

|

博文

【赵渝强老师】阿里云大数据集成开发平台DataWorks

DataWorks是阿里云一站式大数据开发治理平台，支持数据集成、开发、建模、分析、质量监控、服务化及迁移等全链路功能，兼容多种计算引擎，助力企业高效构建数据中台，实现数据资产化与价值挖掘。

744 6 6

来自：大数据开发治理DataWorks 版块

winx_19970108018

|

8月前

|

搜索推荐 API 开发者

|

博文

1688图片搜索API | 上传图片秒找同款 | 相似商品精准推荐

1688图片搜索API是阿里巴巴B2B平台提供的图像识别服务，支持通过上传商品图片在海量商品库中快速查找同款或相似商品。适用于电商比价、批量搜索及系统集成，提升采购效率。建议使用清晰图片并优化分类与分页设置，以提高搜索准确率和性能表现。

806 0 0

nick6507384252

|

8月前

|

机器学习/深度学习人工智能计算机视觉

|

博文

AAAI2025！北理工团队提出FBRT-YOLO：面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测

FBRT-YOLO提出专用于航拍图像的实时目标检测模型，通过轻量化设计、增强多尺度融合与小目标优化，在保证高精度的同时显著提升速度，实现复杂场景下更优的性能平衡。

721 0 0

winx_19970108018

|

8月前

|

监控数据挖掘 API

|

博文

淘宝天猫商品详情API全攻略

淘宝天猫商品详情API是淘宝开放平台的核心接口，支持通过商品ID获取标题、价格、库存、SKU等全维度信息，采用RESTful设计，实时高效，适用于比价系统、库存监控、智能选品等电商应用开发与数据分析场景。

625 0 0

winx_19970108018

|

9月前

|

JSON 监控 API

|

博文

京东商品详情API接口(标题|主图|SKU|价格)

京东商品详情API提供标准化接口，支持通过HTTPS获取商品标题、价格、库存、销量等120+字段，数据实时更新至分钟级。包含jd.item.get和jd.union.open.goods.detail.query等接口，支持批量查询200个SKU，适用于价格监控、竞品分析等电商场景。

1397 156 157

null_is_null

|

11月前

|

机器学习/深度学习存储 JSON

|

博文

PyCharm 创建了第一个项目

在 PyCharm 中创建项目时，合理的目录结构有助于代码、依赖和资源的高效管理。本文详细解析了 PyCharm 的默认目录结构，如 `.idea/`（配置文件）、`venv/`（虚拟环境）、`src/`（源代码）、`tests/`（测试代码）、`data/`（数据文件）等，并提供了文件创建建议和最佳实践。同时介绍了核心代码、脚本文件、测试文件的存放位置，以及 PyCharm 的常用操作技巧，帮助开发者构建清晰、可维护的项目结构。

836 2 2

Deephub

|

11月前

|

机器学习/深度学习算法数据可视化

|

博文

近端策略优化算法PPO的核心概念和PyTorch实现详解

本文深入解析了近端策略优化（PPO）算法的核心原理，并基于PyTorch框架实现了完整的强化学习训练流程。通过Lunar Lander环境展示了算法的全过程，涵盖环境交互、优势函数计算、策略更新等关键模块。内容理论与实践结合，适合希望掌握PPO算法及其实现的读者。

1692 2 2

winx_19970108018

|

11月前

|

JSON Unix API

|

博文

1688查询榜单列表API详解

1688榜单API提供实时热销、新品等商品榜单数据，支持20+品类及40+字段筛选，适用于选品与市场分析。每小时更新，响应迅速。提供Python调用示例，开发者可快速集成。

701 5 5

Deephub

|

11月前

|

人工智能测试技术芯片

|

博文

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

本文介绍了使用四块Framework主板构建AI推理集群的过程，并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试，重点评估其并行推理能力及集群表现。

1141 0 0

魔羯座liaotianfeile

|

11月前

|

API

|

博文

电商API分享全网最全电商API 备用

这是一组淘宝开放平台API接口列表，涵盖商品详情、评论、搜索、上下架、订单管理、物流查询、店铺信息等多种功能，适用于电商应用开发与数据操作。

269 0 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

构建时序感知的智能RAG系统：让AI自动处理动态数据并实时更新知识库

全量抓取还是增量采集？二手房数据采集实战解析

正当红的 Context Layer 到底是什么？

AI搜索重构制造业采购逻辑：基于阿里云的企业级GEOCMS优化实践

伽蓝 x Quick BI：美妆竞争加剧，伽蓝“数”驱增长

极氪 x Quick BI：3年登录纽交所，数字化“原住民”的秘密武器是什么？

圣迪乐 x Quick BI：一枚AI 鸡蛋打破农牧数字化困局，五年营收增长300%

接口添加白名单 IP 地址的作用与价值

深度解析：Transformer 的“灵魂”——QKV 变换的物理直觉

人工智能|大白话YOLOv3,YOLOv4

从理论到实践：在阿里云ECS上部署国密SM4加密U盘管控系统

剪视频不用再开 PR 的 AI 工作流

1688包装信息API接口完全指南（2026版）

一套底座支撑多场景：高德地图基于 Paimon + StarRocks 轨迹服务实践

自然语言查数技术路线对比：本体神经网络如何实现企业级精准问数

SEP-YOLO：当频域分析遇上YOLO，透明物体实例分割迎来新突破，ISCAS 2026

不想再被 API 账单吓一跳？教你用 Python 搭一个本地大模型推理 API

Cnfans 反向海淘代购系统搭建经验

函数计算异步任务在高并发Agent场景下的幂等性与去重实践（附真实踩坑案例）

京东宝贝详情数据采集指南

从群发文案到私人定制：手把手教你微调一个懂人情世故的拜年助手

batch size、sequence length 对显存的非线性影响

想让大模型更懂你？从原理到实践，详解高效微调的全流程

让大模型“开小灶”：手把手教你打造能聊业务的专属AI

手把手教你调出“懂你”的AI：大模型微调实战与资源管理

传统数据库与向量数据库：一个管“是什么”，一个管“像什么”

关键词搜索淘宝商品列表API指南

淘宝图片搜索API（taobao.item_search_img）

如何稳定采集amazon商品数据，有什么好的采集工具？

【赵渝强老师】基于Hudi的大数据湖仓一体架构

量子芯片为什么这么难造？从“画电路”到“跑量子态”，中间全是坑

【AI大模型面试宝典九】- 推理部署篇

低代码技术架构

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

怎么在cursor上使用mcp来采集网页数据，听说brightdata-mcp适合做爬虫，好用吗？

京东商品详情 API 实战指南

构建AI智能体：七十二、交叉验证：从模型评估的基石到大模型时代的演进

具身智能：零基础入门睿尔曼机械臂（四）—— 夹爪无响应？官方例程踩坑与排错实战

爬虫专栏：破解网站检测selenium反爬——“当前环境正在被调试“”

大家在做社媒数据采集时，用selenium和playwright怎么解决爬虫检测呀？

【赵渝强老师】阿里云大数据集成开发平台DataWorks

1688图片搜索API | 上传图片秒找同款 | 相似商品精准推荐

AAAI2025！北理工团队提出FBRT-YOLO：面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测

淘宝天猫商品详情API全攻略

京东商品详情API接口(标题|主图|SKU|价格)

PyCharm 创建了第一个项目

近端策略优化算法PPO的核心概念和PyTorch实现详解

1688查询榜单列表API详解

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

电商API分享 全网最全电商API 备用

大数据与机器学习

活跃用户

相关产品

电商API分享全网最全电商API 备用