手把手带你5分钟搭建企业级AI问答知识库

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 【8月更文挑战第3天】手把手带你5分钟搭建企业级AI问答知识库

配置过程

在正式开始本次体验前,我们需要进行一下环境的准备,比如确保已经拥有阿里云账号,并开通了Hologres、PAI-EAS(机器学习平台)和计算巢服务。下面就以如何开通人工智能平台PAI为例,阐述如何开通服务。

登录PAI控制台,如果你是首次使用PAI,会需要先开通个默认的工作空间。如下:

为了方便,这里地域就直接选择了杭州。如下:

由于本次体验不涉及其他服务,所以组合服务这里不需要勾选,以免产生不必要的费用。首次开通需要授权,点击授权前往RAM访问控制。如下:

点击同意授权即可。如下:

完成授权后返回点击刷新,继续点击“确认开通并创建默认工作空间”。如下:

这里需要等待一小会,即可完成服务的开通。如下:

这里需要注意的是,如果您已领取PAI-EAS免费试用权益,整个实验费用大约为每小时4.634元。如果您无免费试用额度或免费试用机型无库存,整个实验费用大约为每小时12.704元。

接着,我们前往计算巢控制台,在左侧导航栏,选择服务目录。

在搜索框中输入并搜索Hologres+PAI一键部署企业级问答知识库,在Hologres+PAI一键部署企业级问答知识库服务卡片下,单击正式创建。

在计算巢服务为第三方服务对话框中,选中我已阅读并同意《计算巢服务协议》,单击确定。

在创建服务实例页面,需要注意如下几点:

1、若已领取PAI-EAS免费试用权益,地域请您选择与开通PAI-EAS相同的地域。若无免费试用额度或免费试用机型无库存,可随意选择。

2、付费类型,可按需进行选择。但需要注意的是ECS和Hologres实例支持按量付费和包年包月,PAI-EAS实例只支持按量付费。

3、Hologres推荐开通32核版本,以华东1(杭州)为例,每小时11.334元,性能更好。如需要更低规格,可以开通8核版本,以华东1(杭州)为例,每小时2.834元,注意8核仅用于体验,不适合用于生产。

4、选择您希望部署的LLM大模型和PAI-EAS部署大模型的实例规格。大模型选择通义千问-7b(开源)。如果已领取PAI-EAS免费试用权益,请选择试用活动分类下的ecs.gn7i-c8g1.2xlarge.limit机型,免费试用额度内无需付费。

5、PAI-EAS部署WebUI的实例规格。这里选择选择机型ecs.c7.2xlarge 8核16GB。

6、VPC配置,选择开启新建VPC。开启新建VPC会自动生成对应的专有网络VPC实例ID和交换机实例ID,在创建计算巢服务实例时,创建对应的VPC信息。如果不开启,这里就需要手动选择专有网络VPC实例ID和交换机实例ID信息。

其他配置保持默认,点击下一步:确认订单。在确认订单页面,确认订单费用后,选中我已阅读并同意《计算巢服务协议》,然后单击立即创建。

在依赖检查这里会发现一个异常,点击开通权限即可。

这里需要耐心等待部署完成。

部署过程中可以通过点击服务实例ID进入详情,通过日志管理可查看部署详情以及进度。

等待11分钟后,服务实例的状态变为已部署后,我们就可以开始使用知识库。

在服务实例详情页面,您可以获取到endpoint以访问服务,单击endpoint后面的链接。

接下来我们需要配置并连接知识库,在Hologres+大模型WebUI的设置页签,配置user和password。这里的user需要填入阿里云账号或RAM用户的AccessKey ID,AccessKey ID对应的AccessKey Secret。所以需要先创建一个AccessKey。

进入RAM控制台,点击创建AccessKey。

填入手机验证码,并复制保存好AccessKey。

将生成的AccessKey填入配置中并点击连接。

在连接信息中返回连接Hologres成功内容,即说明连接成功。

在上传页签,选择您的专属语料数据文件,然后单击上传。这里直接使用了官网提供的文件。

上传完成后在状态区域,返回“成功上传1个文件 [ example_data.txt, ] !”内容,即说明上传成功。

接下来就可以配置聊天相关的参数了,在聊天页签进行配置即可。

聊天模式有三种可选,他们的区别如下:

  • 向量数据库:使用您在Hologres中上传的语料数据进行向量近似查询问答。
  • 大语言模型:使用原始的预训练大语言模型进行问答。
  • 向量数据库+大语言模型:使用您在Hologres中上传的语料数据进行向量近似查询,然后通过大模型对查询结果进行进一步完善和调整,最终反馈优化后的结果。

完成配置后,我们就可以和模型进行对话了。如下:

输出结果

比如我输入“Hologres是啥”,“Hologres能做什么”,对话如下:

你可以对刚才的对话进行总结,直接点击总结按钮即可。

释放资源

完成体验后,非常且必要的一步就是将部署资源进行释放或者删除,以免产生不必要的费用扣除。操作如下:在服务实例管理页面的私有部署服务页签,找到您创建的Hologres+PAI一键部署企业级问答知识库服务服务实例,单击右侧操作列下的删除。

在您确定要删除当前服务实例吗对话框中,选中我确认删除服务实例及包含的云资源,单击确定删除。

该操作将一键清理掉部署所创建的所有资源,如果你需要保留,这一步操作需要慎重。

使用体验

通过上述部署体验,我总结如下:

  • 通过计算巢服务,可以一键完成Hologres与大规模问答知识库所需的硬件资源与软件资源部署,大大缩短了部署时间,提高了效率。PAI-EAS作为模型在线服务平台,支持用户将模型一键部署为在线推理服务或AI-Web应用,进一步简化了部署流程。
  • Hologres作为一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,能够处理PB级数据的多维分析和即席查询,满足企业级应用对数据处理能力的需求。PAI-EAS适用于实时推理、近实时异步推理等多种AI推理场景,具备自动扩缩容和完整运维监控体系等能力,确保系统的稳定性和可靠性。
  • LangChain是一个开源框架,可以将大模型、向量数据库、定制语料结合,高效完成专属问答知识库的搭建。Hologres现已被LangChain作为向量数据库集成,进一步丰富了问答知识库的功能。
  • 计算巢服务是一个开放给服务商和用户的服务管理PaaS平台,为服务商和用户提供了高效、便捷、安全的服务使用体验。用户可以根据业务需求灵活调整资源配置,实现资源的最大化利用。

除了上述的优点外,其实在体验中还能看到些许不足:

  • 企业级AI问答知识库的构建和运维需要投入大量的资金和资源。除了购买Hologres、PAI-EAS等产品的费用外,还需要考虑人员培训、系统维护、数据存储和传输等方面的成本。
  • 系统依赖于阿里云提供的Hologres、PAI-EAS和计算巢等外部服务,如果外部服务出现故障或中断,可能会对系统的正常运行造成影响。因此,用户需要关注外部服务的稳定性和可靠性,并制定相应的应急预案。
  • 上传语料数据文件耗时较长,官网提供的一个不到8kb的文件,上传硬是花费了2分钟。此外,号称5分钟的部署,实际耗时是11分钟。体验耗时就如此,那正式环境岂不是需要更久,非常期待后期优化。
  • 虽然一键部署简化了操作流程,但整个系统的构建和运维仍然需要较高的技术门槛。用户需要具备一定的云计算、大数据处理、AI算法等方面的知识和技能,才能充分发挥系统的全部优势。
相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
目录
相关文章
|
3月前
|
机器学习/深度学习 数据采集 人工智能
文档智能 & RAG 让AI大模型更懂业务 —— 阿里云LLM知识库解决方案评测
随着数字化转型的深入,企业对文档管理和知识提取的需求日益增长。阿里云推出的文档智能 & RAG(Retrieval-Augmented Generation)解决方案,通过高效的内容清洗、向量化处理、精准的问答召回和灵活的Prompt设计,帮助企业构建强大的LLM知识库,显著提升企业级文档管理的效率和准确性。
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
PeterCat 是一款开源的智能答疑机器人,能够自动抓取 GitHub 上的文档和 issue 构建知识库,提供对话式答疑服务,帮助开发者和社区维护者高效解决技术问题。
50 7
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
|
5天前
|
数据采集 人工智能 运维
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
|
2天前
|
数据采集 人工智能 运维
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案。
|
6天前
|
人工智能 安全 算法
PAI负责任的AI解决方案: 安全、可信、隐私增强的企业级AI
在《PAI可信AI解决方案》会议中,分享了安全、可信、隐私增强的企业级AI。会议围绕三方面展开:首先通过三个案例介绍生活和技术层面的挑战;其次阐述构建AI的关键要素;最后介绍阿里云PAI的安全功能及未来展望,确保数据、算法和模型的安全与合规,提供全方位的可信AI解决方案。
|
2月前
|
人工智能 自然语言处理 前端开发
VideoChat:高效学习新神器!一键解读音视频内容,结合 AI 生成总结内容、思维导图和智能问答
VideoChat 是一款智能音视频内容解读助手,支持批量上传音视频文件并自动转录为文字。通过 AI 技术,它能快速生成内容总结、详细解读和思维导图,并提供智能对话功能,帮助用户更高效地理解和分析音视频内容。
127 6
VideoChat:高效学习新神器!一键解读音视频内容,结合 AI 生成总结内容、思维导图和智能问答
|
2天前
|
人工智能 运维 API
PAI企业级能力升级:应用系统构建、高效资源管理、AI治理
PAI平台针对企业用户在AI应用中的复杂需求,提供了全面的企业级能力。涵盖权限管理、资源分配、任务调度与资产管理等模块,确保高效利用AI资源。通过API和SDK支持定制化开发,满足不同企业的特殊需求。典型案例中,某顶尖高校基于PAI构建了融合AI与HPC的科研计算平台,实现了作业、运营及运维三大中心的高效管理,成功服务于校内外多个场景。
|
2月前
|
存储 人工智能 自然语言处理
基于LLamaIndex构建企业级私有知识库:RAG Workflow工作流详解
【11月更文挑战第12天】随着生成式AI的快速发展,企业对智能化信息检索和生成的需求日益增加。传统的知识库系统往往局限于静态的数据存储和查询,难以满足复杂多变的业务需求。而检索增强生成(RAG, Retrieval-Augmented Generation)技术的出现,为企业级私有知识库的建设提供了新的解决方案。LLamaIndex作为专为LLMs(大型语言模型)设计的私有知识索引工具,结合RAG Workflow工作流,能够构建高效、智能的企业级私有知识库,满足企业对于知识管理和智能问答的多样化需求。
159 4
|
2月前
|
Web App开发 人工智能 自然语言处理
WebChat:开源的网页内容增强问答 AI 助手,基于 Chrome 扩展的最佳实践开发,支持自定义 API 和本地大模型
WebChat 是一个基于 Chrome 扩展开发的 AI 助手,能够帮助用户理解和分析当前网页的内容,支持自定义 API 和本地大模型。
112 0
|
3月前
|
人工智能
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
187 2

热门文章

最新文章