数据采集

首页 标签 数据采集
# 数据采集 #
关注
21439内容
京东商品详情 API(jd.item_get)
京东商品详情API(jd.item_get)是京东开放平台提供的标准化REST接口,支持获取商品标题、价格、库存、规格、促销及售后等全量信息,适用于数据采集、价格监控、比价工具及代购系统等场景。
|
1月前
|
智能体来了:从 0 到 1 构建 RAG 检索增强系统
随着大模型在真实业务中的应用不断深入,单纯依赖模型参数内知识已难以满足需求。检索增强生成(RAG,Retrieval-Augmented Generation)成为连接大模型与外部知识的重要方式。 本文从 0 到 1 系统讲解 RAG 的核心原理、系统结构及落地步骤,帮助读者构建一个可用、可扩展的 RAG 检索增强系统,为智能体和企业级 AI 应用提供可靠基础。
PPO 与 DP
本文通俗解析PPO与DPO两大偏好优化算法:PPO为间接优化,需训练奖励模型,稳定但流程复杂;DPO为直接优化,跳过奖励模型,简洁高效但对数据质量要求高。对比原理、流程、优劣及适用场景,助你按业务需求科学选型。
工业场景下AR+AI图像识别:精准选型赋能运维与质检
本文解析AR+AI图像识别在工业质检与运维中的适配逻辑:明确5类不适配场景(空间受限、高速动态、细微特征、近距离读取、全自动产线)及5类高价值适配场景(传统产线、经验依赖、疲劳检测、高风险环节、多流程运维),助力企业科学选型,避免技术错配,夯实数字化转型基础。(239字)
大模型强化学习全解:从PPO、DPO到DeepSeek的GRPO,一文搞懂强化对齐的奥秘
本文用生活化比喻详解大模型强化学习三大主流方法:PPO(精准但昂贵的“私教班”)、DPO(依赖高质量数据的“改错本”)、GRPO(DeepSeek创新的“小组竞赛制”)。零公式、重逻辑,帮你理解RL如何让模型从“会说”进阶为“说好”。
|
1月前
|
AI智能体对传统行业的冲击与数字化生产力重构定义
内容摘要:本文深度解析AI智能体(AI Agents)如何从“工具”演化为“数字化”,系统性剖析其对制造、金融、零售等传统行业的替代性冲击。通过构建“感知-决策-执行”的底层逻辑,为企业提供从流程升级到数字化生产力重构员工的可落地路径。
高质量数据集与数字孪生:制造业的“黄金燃料”与“虚拟试炼场”
本文深入解析高质量数据集与数字孪生融合如何驱动智能制造跃迁:前者是AI时代的“黄金燃料”,强调完整性、合规性与场景适配;后者作为物理世界的“虚拟克隆体”,实现设计—生产—运维全链优化。二者协同催生“数据—仿真—模型”飞轮效应,正加速中国制造业向“中国智造”转型。
|
1月前
|
模型翻车实录:为什么损失越低,模型反而越爱“胡说八道”?
本文揭露微调中“损失下降≠模型安全”的陷阱:损失仅反映Token预测准确率,却掩盖逻辑错误、风格偏差与关键风险(如漏“不”字致合规事故)。提出构建行为安全防火墙三步法——数据清洗增强拒答样本、工具监控、行为探针回归测试,并强调拒答率、自信度、越界率三大核心指标。
|
1月前
|
Python多线程与多进程:性能对比与场景选择
本文深入剖析Python并发编程核心抉择:多线程 vs 多进程。结合GIL机制、真实性能测试(CPU密集型多进程快3.4倍,I/O密集型多线程快25%)、资源开销对比及混合架构实践,提供场景化决策树与调优指南,助开发者科学选型。(239字)
免费试用