阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库

简介: 阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库


近日,在国际 AI 大数据峰会上,阿里云推出了备受业界关注的企业级大模型检索增强生成(RAG)解决方案,可以给大模型装上“专属知识外挂”,企业仅需几次点击即可连接PB级规模数据,让大模型成为洞悉行业和企业知识的专家,大幅提升回答表现。


“检索增强生成”

简称RAG(Retrieval-augmented Generation),是当下最热门的大模型前沿技术之一。如果将“微调(finetune)”理解成大模型内化吸收知识的过程,那么RAG就相当于给大模型装上了“知识外挂”,基础大模型不用再训练即可随时调用特定领域知识


阿里云副总裁、计算平台事业部负责人汪军华介绍,通过RAG技术,大语言模型在回答问题时,可以从企业知识库中检索最新的相关信息来生成内容,从而提高回答的准确性、关联性和新鲜度,并解决幻觉问题。同时,RAG技术外挂的私有数据不参与大模型训练,保证了企业的数据安全。


阿里云副总裁、计算平台事业部负责人汪军华


RAG技术显著提升了大模型表现,并减少了企业开发时间,但因涉及数据检索、信息增强、AI生成等过程,工程复杂度很高。阿里云本次推出的一站式企业级大模型检索增强生成RAG解决方案,将极大降低用户自主搭建专属企业RAG的门槛和成本。



阿里云魔搭社区提供近3000个高性能模型,用户可在魔搭上下载基础大模型进行快速开发。同时,阿里云RAG解决方案可调用阿里云上的云产品和向量引擎,用户可快速将基础模型与PB级数据源连接,打造专属的智能问答系统


在检索环节,阿里云大数据引擎可提供超低时延、超高并发的海量检索计算,并按需匹配集群资源,节省10%-30%计算成本。


在模型服务环节,PAI-EAS推理平台一站式提供模型部署及推理加速的全链路服务,新发布的serverless计价模式更可将用户使用成本降低50%。 同时,可将非结构化的文本及多模态数据转化为精准矢量数据的向量技术,也是RAG解决方案的关键能力,阿里云通过多项技术提升了RAG检索精度和效率。


汪军华介绍,阿里云RAG解决方案配备了丰富的向量化工具,可自动进行矢量转换和检索。同时,除向量检索外,阿里云还提供全文检索和外部搜索api等多种检索增强方式。


据了解,RAG技术在开放域回答、对话系统、文本生成、搜索增强、LLM交互式应用等领域应用前景广阔。海外知名消费健康公司赫力昂(Haleon)已与阿里云达成合作,利用阿里云研发的通义千问大模型及RAG技术为中国消费者打造了一款“AI营养师”产品。结合赫力昂内部沉淀的营养知识库,该产品可以准确理解用户提问,并给出个性化的营养建议。


近一年多来,在“AI驱动”新战略下,阿里云计算产品正面向AI需求升级,让企业和开发者“做AI、用AI,就上阿里云”。阿里云目前已在IaaS+PaaS层形成完善的AI基础设施,通义、百川智能、智谱AI、零一万物、昆仑万维等国内一半大模型公司跑在阿里云上。同时,阿里云作为MaaS理念提出者,打造了丰富的模型服务,魔搭是国内规模最大的AI模型社区,通义千问实现全尺寸、全模态开源。


/ END /


相关阅读

Related reading


目录
相关文章
|
1月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
1月前
|
人工智能 自然语言处理 数据库
RAG:打破大模型的知识壁垒
RAG:打破大模型的知识壁垒
261 113
|
2月前
|
人工智能 自然语言处理 NoSQL
超越基础提示:用RAG为你的大模型注入“新鲜记忆”
超越基础提示:用RAG为你的大模型注入“新鲜记忆”
255 101
|
2月前
|
人工智能 自然语言处理 搜索推荐
超越幻觉:RAG如何为AI大模型注入“真实”的灵魂
超越幻觉:RAG如何为AI大模型注入“真实”的灵魂
213 81
|
2月前
|
数据采集 人工智能 文字识别
从CLIP到GPT-4V:多模态RAG背后的技术架构全揭秘
本文深入解析多模态RAG技术,涵盖其基本原理、核心组件与实践路径。通过整合文本、图像、音频等多源信息,实现跨模态检索与生成,拓展AI应用边界。内容详实,建议收藏学习。
447 50
从CLIP到GPT-4V:多模态RAG背后的技术架构全揭秘
|
28天前
|
人工智能 安全 开发工具
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
331 24
|
29天前
|
机器学习/深度学习 人工智能 JSON
PHP从0到1实现 AI 智能体系统并且训练知识库资料
本文详解如何用PHP从0到1构建AI智能体,涵盖提示词设计、记忆管理、知识库集成与反馈优化四大核心训练维度,结合实战案例与系统架构,助你打造懂业务、会进化的专属AI助手。
184 6
|
8月前
|
SQL
【YashanDB知识库】手工迁移Doris数据到崖山分布式
【YashanDB知识库】手工迁移Doris数据到崖山分布式
|
8月前
|
存储 人工智能 搜索推荐
WiseMindAI:一款AI智能知识库,数据完全本地化,支持文档对话、10+种文档、10+AI大模型等
WiseMindAI 是一款由 Chris 开发的 AI 智能学习助手,支持数据完全本地化存储,确保用户隐私安全。它兼容多种文档格式(如 PDF、Markdown 等),并提供 AI 文档总结、智能笔记、沉浸式翻译、知识卡片生成等功能。此外,WiseMindAI 支持 10+ 大语言模型和自定义 AI 插件,适用于 Windows 和 Mac 平台,支持简体中文、繁体中文及英文。
713 74
WiseMindAI:一款AI智能知识库,数据完全本地化,支持文档对话、10+种文档、10+AI大模型等