阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库

简介: 阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库


近日,在国际 AI 大数据峰会上,阿里云推出了备受业界关注的企业级大模型检索增强生成(RAG)解决方案,可以给大模型装上“专属知识外挂”,企业仅需几次点击即可连接PB级规模数据,让大模型成为洞悉行业和企业知识的专家,大幅提升回答表现。


“检索增强生成”

简称RAG(Retrieval-augmented Generation),是当下最热门的大模型前沿技术之一。如果将“微调(finetune)”理解成大模型内化吸收知识的过程,那么RAG就相当于给大模型装上了“知识外挂”,基础大模型不用再训练即可随时调用特定领域知识


阿里云副总裁、计算平台事业部负责人汪军华介绍,通过RAG技术,大语言模型在回答问题时,可以从企业知识库中检索最新的相关信息来生成内容,从而提高回答的准确性、关联性和新鲜度,并解决幻觉问题。同时,RAG技术外挂的私有数据不参与大模型训练,保证了企业的数据安全。


阿里云副总裁、计算平台事业部负责人汪军华


RAG技术显著提升了大模型表现,并减少了企业开发时间,但因涉及数据检索、信息增强、AI生成等过程,工程复杂度很高。阿里云本次推出的一站式企业级大模型检索增强生成RAG解决方案,将极大降低用户自主搭建专属企业RAG的门槛和成本。



阿里云魔搭社区提供近3000个高性能模型,用户可在魔搭上下载基础大模型进行快速开发。同时,阿里云RAG解决方案可调用阿里云上的云产品和向量引擎,用户可快速将基础模型与PB级数据源连接,打造专属的智能问答系统


在检索环节,阿里云大数据引擎可提供超低时延、超高并发的海量检索计算,并按需匹配集群资源,节省10%-30%计算成本。


在模型服务环节,PAI-EAS推理平台一站式提供模型部署及推理加速的全链路服务,新发布的serverless计价模式更可将用户使用成本降低50%。 同时,可将非结构化的文本及多模态数据转化为精准矢量数据的向量技术,也是RAG解决方案的关键能力,阿里云通过多项技术提升了RAG检索精度和效率。


汪军华介绍,阿里云RAG解决方案配备了丰富的向量化工具,可自动进行矢量转换和检索。同时,除向量检索外,阿里云还提供全文检索和外部搜索api等多种检索增强方式。


据了解,RAG技术在开放域回答、对话系统、文本生成、搜索增强、LLM交互式应用等领域应用前景广阔。海外知名消费健康公司赫力昂(Haleon)已与阿里云达成合作,利用阿里云研发的通义千问大模型及RAG技术为中国消费者打造了一款“AI营养师”产品。结合赫力昂内部沉淀的营养知识库,该产品可以准确理解用户提问,并给出个性化的营养建议。


近一年多来,在“AI驱动”新战略下,阿里云计算产品正面向AI需求升级,让企业和开发者“做AI、用AI,就上阿里云”。阿里云目前已在IaaS+PaaS层形成完善的AI基础设施,通义、百川智能、智谱AI、零一万物、昆仑万维等国内一半大模型公司跑在阿里云上。同时,阿里云作为MaaS理念提出者,打造了丰富的模型服务,魔搭是国内规模最大的AI模型社区,通义千问实现全尺寸、全模态开源。


/ END /


相关阅读

Related reading


目录
相关文章
|
6月前
|
人工智能 自然语言处理 前端开发
最佳实践2:用通义灵码以自然语言交互实现 AI 高考志愿填报系统
本项目旨在通过自然语言交互,结合通义千问AI模型,构建一个智能高考志愿填报系统。利用Vue3与Python,实现信息采集、AI推荐、专业详情展示及数据存储功能,支持响应式设计与Supabase数据库集成,助力考生精准择校选专业。(239字)
650 12
|
7月前
|
人工智能 数据库 索引
超越幻觉:检索增强生成如何为AI大模型“装上”事实核查系统
超越幻觉:检索增强生成如何为AI大模型“装上”事实核查系统
457 107
|
6月前
|
人工智能 自然语言处理 安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
1113 23
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
拔俗当AI成为你的“心灵哨兵”:多模态心理风险预警系统如何工作?
AI多模态心理预警系统通过融合表情、语调、文字、绘画等多维度数据,结合深度学习与多模态分析,实时评估心理状态。它像“心灵哨兵”,7×24小时动态监测情绪变化,发现抑郁、焦虑等风险及时预警,兼顾隐私保护,助力早期干预,用科技守护心理健康。(238字)
274 1
|
7月前
|
存储 机器学习/深度学习 人工智能
云栖 2025|阿里云 Qwen3 系列领衔:AI 模型全栈突破与开发者落地指南
阿里云发布Qwen3全栈AI体系,七大模型升级、性能全球领先,开源生态稳居第一。从底层基建到开发工具链全面优化,助力企业高效落地AI应用,共建超级AI云生态。
2244 11
|
7月前
|
机器学习/深度学习 人工智能 数据安全/隐私保护
阿里云 Qwen3 全栈 AI 模型:技术解析、开发者实操指南与 100 万企业落地案例
阿里云发布Qwen3全栈AI体系,推出Qwen3-Max、Qwen3-Next等七大模型,性能全球领先,开源生态超6亿次下载。支持百万级上下文、多模态理解,训练成本降90%,助力企业高效落地AI。覆盖制造、金融、创作等场景,提供无代码与代码级开发工具,共建超级AI云生态。
1455 6
|
6月前
|
自然语言处理 JavaScript 搜索推荐
基于大模型技术的随手记系统
本研究聚焦基于大模型技术的随手记系统,结合Spring Boot、Vue、Java与MySQL,构建智能笔记平台。系统利用大模型强大的语言理解与生成能力,实现自然语言输入、智能分类、标签化、内容摘要及个性化推荐,提升信息管理效率与用户体验,推动传统记录方式向智能化转型。
|
6月前
|
人工智能 算法 数据安全/隐私保护
拔俗AI多模态心理风险预警系统:用科技守护心理健康的第一道防线
AI多模态心理风险预警系统通过语音、文本、表情与行为数据,智能识别抑郁、焦虑等心理风险,实现早期干预。融合多源信息,提升准确率,广泛应用于校园、企业,助力心理健康服务从“被动响应”转向“主动预防”,为心灵筑起智能防线。(238字)
776 0
|
6月前
|
存储 人工智能 搜索推荐
拔俗AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教融合大语言模型、教育知识图谱、多模态感知与智能体技术,重构“教、学、评、辅”全链路。通过微调LLM、精准诊断错因、多模态交互与自主任务规划,实现个性化教学。轻量化部署与隐私保护设计保障落地安全,未来将向情感感知与教育深度协同演进。(238字)
757 0

热门文章

最新文章

下一篇
开通oss服务