机器学习/深度学习

首页 标签 机器学习/深度学习
# 机器学习/深度学习 #
关注
72303内容
RAG 文档切分攻略:做好这步,检索精度提升 50%
本文深度解析RAG系统中易被忽视却至关重要的文档切分环节,系统拆解固定长度、语义结构化、混合切分三大方法,结合片段长度、重叠率、元数据标注等5大实操技巧与典型场景案例,助你避开常见陷阱,显著提升检索精度与大模型回答质量。
|
18天前
|
保姆级干货:如何用DPO快速调教出属于你的专属AI助手?
本文详解如何通过RLHF技术提升大模型情商,重点对比PPO(需奖励模型、稳定性高)与DPO(直接学习偏好、流程简洁)两大核心算法,并提供数据准备、训练配置及效果评估的实操指南,助力AI从“知识渊博”迈向“高情商助手”。
|
18天前
|
你的Clawdbot还是“废物”?因为缺了这套隐形外挂!
OpenClaw(原Clawdbot)亟需突破信息孤岛。数眼智能为其量身打造五大API:网页阅读+联网搜索让AI“看见”实时世界;OCR解析赋能文档理解;天气MCP等标准化接口接入垂直能力——秒级响应、高精度结构化输出,助智能体真正落地现实任务。(239字)
让ChatGPT更懂你:深入浅出解析大模型微调中的强化学习(PPO/DPO篇)
本文深入浅出解析大模型对齐人类偏好的两大核心方法:PPO(需训练奖励模型、在线优化,强但复杂)与DPO(直接学习“好vs差”对比数据、离线高效、更易用)。对比原理、流程与实践,揭示为何DPO正成为主流选择,并强调高质量偏好数据与平台化工具的关键价值。(239字)
大模型太“通用”?一文搞懂模型微调:从原理到实战,让AI听懂你的行话
本文深入浅出地讲解大模型微调的必要性、原理与实践:针对通用LLM在专业性、时效性、幻觉及业务适配上的不足,详解LoRA等参数高效微调技术,并以IT知识助手为例,手把手演示数据准备、模型选择、训练评估到部署的全流程,助力开发者低成本打造专属领域专家模型。(239字)
|
18天前
|
torch.compile 加速原理:kernel 融合与缓冲区复用
PyTorch即时执行模式因频繁kernel启动和重复显存搬运导致内存带宽瓶颈,GPU算力利用率低。`torch.compile`通过TorchDynamo捕获FX图、TorchInductor实现操作融合、缓冲区复用与Triton自动调优,显著降低VRAM访问次数。官方测试显示平均加速20%–36%,一行代码即可启用,大幅提升推理吞吐与能效。
|
19天前
|
解决垂直领域“幻觉”难题:智能客服机器人知识库构建与微调策略深度解析
大模型在客服场景的落地常受困于幻觉问题。合力亿捷通过悦问大模型知识库与 MPaaS 平台,深度融合 RAG 技术与可视化业务流程编排,从知识治理与白盒化管理双重维度构建确定性。这种培养型交付方法论有效解决了垂直领域应答不准的痛点,使 AI 真正进化为高准确率的数字员工。
|
19天前
|
当AI席卷一切,这些10+年创始人如何打出自己的王牌?
2025年是科技“脱虚向实”的转折点。福布斯中国评选出新一代颠覆力创始人:梁文锋(DeepSeek)以开源降本重构AI范式;王兴兴(宇树)让机器人从演示走向量产;黎展(探迹)打造“数字员工”赋能企业真实场景;赵同阳(众擎)以体能先行开辟具身智能新路径。他们用硬科技破解真问题,定义中国创新新范式。
TensorFlow 入门指南
TensorFlow 是 Google 开源的主流机器学习框架,支持从研究到生产的全周期开发。其核心优势在于:灵活的数据流图、Keras 高级API易上手、底层API可深度定制,以及TensorBoard、TFLite、TF Serving等完善生态,广泛应用于图像识别、自然语言处理等领域。(239字)
PPO算法全解:让AI“学步”更稳的强化学习秘诀
本文用“教孩子骑车”比喻,生动解析PPO算法如何通过“信任区域”约束与Clipping裁剪机制,实现稳定高效的强化学习。避开复杂数学,讲清其在RLHF、大模型对齐中的核心作用,并提供可运行代码与调参指南。(239字)
免费试用