阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库

简介: 阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库


近日,在国际 AI 大数据峰会上,阿里云推出了备受业界关注的企业级大模型检索增强生成(RAG)解决方案,可以给大模型装上“专属知识外挂”,企业仅需几次点击即可连接PB级规模数据,让大模型成为洞悉行业和企业知识的专家,大幅提升回答表现。


“检索增强生成”

简称RAG(Retrieval-augmented Generation),是当下最热门的大模型前沿技术之一。如果将“微调(finetune)”理解成大模型内化吸收知识的过程,那么RAG就相当于给大模型装上了“知识外挂”,基础大模型不用再训练即可随时调用特定领域知识


阿里云副总裁、计算平台事业部负责人汪军华介绍,通过RAG技术,大语言模型在回答问题时,可以从企业知识库中检索最新的相关信息来生成内容,从而提高回答的准确性、关联性和新鲜度,并解决幻觉问题。同时,RAG技术外挂的私有数据不参与大模型训练,保证了企业的数据安全。


阿里云副总裁、计算平台事业部负责人汪军华


RAG技术显著提升了大模型表现,并减少了企业开发时间,但因涉及数据检索、信息增强、AI生成等过程,工程复杂度很高。阿里云本次推出的一站式企业级大模型检索增强生成RAG解决方案,将极大降低用户自主搭建专属企业RAG的门槛和成本。



阿里云魔搭社区提供近3000个高性能模型,用户可在魔搭上下载基础大模型进行快速开发。同时,阿里云RAG解决方案可调用阿里云上的云产品和向量引擎,用户可快速将基础模型与PB级数据源连接,打造专属的智能问答系统


在检索环节,阿里云大数据引擎可提供超低时延、超高并发的海量检索计算,并按需匹配集群资源,节省10%-30%计算成本。


在模型服务环节,PAI-EAS推理平台一站式提供模型部署及推理加速的全链路服务,新发布的serverless计价模式更可将用户使用成本降低50%。 同时,可将非结构化的文本及多模态数据转化为精准矢量数据的向量技术,也是RAG解决方案的关键能力,阿里云通过多项技术提升了RAG检索精度和效率。


汪军华介绍,阿里云RAG解决方案配备了丰富的向量化工具,可自动进行矢量转换和检索。同时,除向量检索外,阿里云还提供全文检索和外部搜索api等多种检索增强方式。


据了解,RAG技术在开放域回答、对话系统、文本生成、搜索增强、LLM交互式应用等领域应用前景广阔。海外知名消费健康公司赫力昂(Haleon)已与阿里云达成合作,利用阿里云研发的通义千问大模型及RAG技术为中国消费者打造了一款“AI营养师”产品。结合赫力昂内部沉淀的营养知识库,该产品可以准确理解用户提问,并给出个性化的营养建议。


近一年多来,在“AI驱动”新战略下,阿里云计算产品正面向AI需求升级,让企业和开发者“做AI、用AI,就上阿里云”。阿里云目前已在IaaS+PaaS层形成完善的AI基础设施,通义、百川智能、智谱AI、零一万物、昆仑万维等国内一半大模型公司跑在阿里云上。同时,阿里云作为MaaS理念提出者,打造了丰富的模型服务,魔搭是国内规模最大的AI模型社区,通义千问实现全尺寸、全模态开源。


/ END /


相关阅读

Related reading


目录
相关文章
|
12月前
|
人工智能 自然语言处理 知识图谱
Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库
Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台,支持多格式文档处理和复杂知识关系查询,具备多模型适配和智能体拓展能力。
3112 55
Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库
|
7月前
|
存储 人工智能 自然语言处理
RAG:增强大模型知识库的新范式
RAG:增强大模型知识库的新范式
686 99
|
6月前
|
机器学习/深度学习 人工智能 JSON
PHP从0到1实现 AI 智能体系统并且训练知识库资料
本文详解如何用PHP从0到1构建AI智能体,涵盖提示词设计、记忆管理、知识库集成与反馈优化四大核心训练维度,结合实战案例与系统架构,助你打造懂业务、会进化的专属AI助手。
757 6
|
8月前
|
人工智能 监控 算法
构建时序感知的智能RAG系统:让AI自动处理动态数据并实时更新知识库
本文系统构建了一个基于时序管理的智能体架构,旨在应对动态知识库(如财务报告、技术文档)在问答任务中的演进与不确定性。通过六层设计(语义分块、原子事实提取、实体解析、时序失效处理、知识图构建、优化知识库),实现了从原始文档到结构化、时间感知知识库的转化。该架构支持RAG和多智能体系统,提升了推理逻辑性与准确性,并通过LangGraph实现自动化工作流,强化了对持续更新信息的处理能力。
1055 5
|
10月前
|
人工智能 数据库
智能体(AI Agent)开发实战之【LangChain】(四)结合大模型基于RAG实现本地知识库问答和纠错
本文介绍如何基于RAG实现知识库问答系统的输入内容纠错功能。通过加载本地知识库、构建向量数据库,结合大语言模型对输入文本进行检索比对与纠错优化,提升问答准确性。
|
10月前
|
数据采集 存储 人工智能
智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
|
10月前
|
人工智能 自然语言处理 数据挖掘
智能体(AI Agent)开发实战之【LangChain】(三)结合大模型基于RAG实现本地知识库问答优化
智能体(AI Agent)开发实战之【LangChain】(三)结合大模型基于RAG实现本地知识库问答优化
|
10月前
|
人工智能 自然语言处理 JavaScript
【开源项目】MaxKB4J基于java开发的工作流和 RAG智能体的知识库问答系统
MaxKB4J是一款基于Java开发的开源LLM工作流应用与RAG知识库问答系统,结合MaxKB和FastGPT优势,支持智能客服、企业知识库等场景。它开箱即用,可直接上传/爬取文档,支持多种大模型(如Qwen、通义千问等),具备灵活的工作流编排能力,并无缝嵌入第三方系统。技术栈包括Vue.js、Springboot3、PostgreSQL等,提供稳定高效的智能问答解决方案。访问地址:`http://localhost:8080/ui/login`,项目详情见[Gitee](https://gitee.com/taisan/MaxKB4j)。
|
9月前
|
存储 自然语言处理 监控
民航机场大模型私有知识库搭建步骤:技术选型 + 实施路径全解析!
近年来,民航机场面临知识管理难题,大模型技术为构建高效、安全的企业知识库提供了新思路。本文介绍知识库发展历程、大模型应用挑战,并详述私有化部署策略与八大实施步骤,助力民航提升运营效率与服务质量。

热门文章

最新文章