机器学习/深度学习

首页 标签 机器学习/深度学习
# 机器学习/深度学习 #
关注
71349内容
|
14小时前
|
大模型训练的双引擎:自监督学习与强化学习
自监督学习从无标签数据中自我学习,降低标注成本;强化学习通过环境交互试错优化决策。二者结合实现高效、安全、对齐人类价值观的智能系统,推动AI迈向通用化与实用化新阶段。
|
18小时前
| |
AI 十大论文精讲(三):RLHF 范式奠基 ——InstructGPT 如何让大模型 “听懂人话”
本文解读AI十大核心论文之二——《Training Language Models to Follow Instructions with Human Feedback》。该论文提出RLHF框架,通过“监督微调-奖励建模-强化学习”三步法,首次实现大模型与人类意图的有效对齐,推动GPT-3进化为更安全、可信的InstructGPT,奠定ChatGPT等后续模型的技术基石,开启大模型“从博学到好用”的新时代。
|
18小时前
| |
AI 十大论文精讲(二):GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力?
摘要 2020年发表的《Language Models are Few-Shot Learners》(GPT-3论文)开创了AI新时代。该论文突破性地证明:当Transformer模型参数规模扩大到1750亿时,仅通过文本交互即可实现任务无关的少样本学习。GPT-3采用"预训练+提示词"的新范式,无需微调就能在翻译、问答等40+任务上展现强大性能。论文系统验证了模型在语言建模、闭卷问答等9类任务中的表现,其中在LAMBADA长文本任务上准确率达86.4%,较此前最优提升18.4%。这一研
|
18小时前
|
电商图片搜索:技术破局与商业落地,重构“视觉到交易”全链路
图片搜索技术正成为电商核心竞争力,从找货、运营到品牌维权,贯穿全链路提效。本文详解其技术原理与商业落地,揭示如何用“视觉语言”重构电商未来。
|
19小时前
| |
来自: 弹性计算
阿里云第九代云服务器c9i/g9i/r9i怎么样?性能、应用场景与活动价格参考
阿里云推出的第九代云服务器c9i、g9i、r9i实例,搭载最新一代的英特尔® 至强® 6 处理器,相比第8代单核算力最大提升20%,适用于在线游戏、通用互联网应用、视频编解码、数据库应用、搜索推荐等场景,已为海量企业客户带来显著性能跃升。本文为大家深入讲解这三款实例的性能优势、适用场景以及活动价格情况,为大家提供详尽的选购指南。
PAIFuser:面向图像视频的训练推理加速框架
阿里云PAI推出PAIFuser框架,专为视频生成模型设计,通过模型并行、量化优化、稀疏运算等技术,显著提升DiT架构的训练与推理效率。实测显示,推理耗时最高降低82.96%,训练时间减少28.13%,助力高效低成本AI视频生成。
|
22小时前
|
NeurlPS2025| 告别手动制表:电子科大+之江实验室提出Table2LaTeX-RL创新性高保真表格生成方法
电子科技大学联合之江实验室提出Table2LaTeX-RL,利用多模态大模型与双奖励强化学习(VSGRPO),实现高保真表格图像到LaTeX转换。该方法在复杂表上表现卓越,CW-SSIM达0.6145,TEDS-Structure达0.9218,编译率高达0.9917,显著优于现有方法,尤其适用于科学文档中含合并单元格、嵌套结构的复杂表格重建。
从Transformer到LLaMA:AI大模型工程化实践完整路径解析
本文系统拆解大模型技术全栈,涵盖数学基础、Transformer架构、微调推理、LangChain应用与RAG系统构建,结合GLM4等实战案例,打通从原理到工程落地的完整路径,助力开发者进阶AI核心能力。
|
1天前
| |
构建AI智能体:二十四、RAG的高效召回方法论:提升RAG系统召回率的三大策略实践
本文探讨了检索增强生成(RAG)系统中的高效召回技术。RAG系统通过检索相关文档增强大语言模型的回答质量,但性能受制于垃圾进,垃圾出原则。为提高召回效果,文章重点分析了三种方法:Small-to-Big通过大小文本块映射兼顾检索精度与上下文丰富度;索引扩展(如HyDE)利用大模型生成假设文档来优化检索;双向改写弥合用户查询与文档表述的差异。这些方法从不同角度解决了RAG系统中的语义鸿沟、词汇不匹配等核心问题,可单独或组合使用。高效召回技术能显著提升RAG系统的回答质量和效率。
免费试用