手把手带你5分钟搭建企业级AI问答知识库

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 【8月更文挑战第3天】手把手带你5分钟搭建企业级AI问答知识库

配置过程

在正式开始本次体验前,我们需要进行一下环境的准备,比如确保已经拥有阿里云账号,并开通了Hologres、PAI-EAS(机器学习平台)和计算巢服务。下面就以如何开通人工智能平台PAI为例,阐述如何开通服务。

登录PAI控制台,如果你是首次使用PAI,会需要先开通个默认的工作空间。如下:

为了方便,这里地域就直接选择了杭州。如下:

由于本次体验不涉及其他服务,所以组合服务这里不需要勾选,以免产生不必要的费用。首次开通需要授权,点击授权前往RAM访问控制。如下:

点击同意授权即可。如下:

完成授权后返回点击刷新,继续点击“确认开通并创建默认工作空间”。如下:

这里需要等待一小会,即可完成服务的开通。如下:

这里需要注意的是,如果您已领取PAI-EAS免费试用权益,整个实验费用大约为每小时4.634元。如果您无免费试用额度或免费试用机型无库存,整个实验费用大约为每小时12.704元。

接着,我们前往计算巢控制台,在左侧导航栏,选择服务目录。

在搜索框中输入并搜索Hologres+PAI一键部署企业级问答知识库,在Hologres+PAI一键部署企业级问答知识库服务卡片下,单击正式创建。

在计算巢服务为第三方服务对话框中,选中我已阅读并同意《计算巢服务协议》,单击确定。

在创建服务实例页面,需要注意如下几点:

1、若已领取PAI-EAS免费试用权益,地域请您选择与开通PAI-EAS相同的地域。若无免费试用额度或免费试用机型无库存,可随意选择。

2、付费类型,可按需进行选择。但需要注意的是ECS和Hologres实例支持按量付费和包年包月,PAI-EAS实例只支持按量付费。

3、Hologres推荐开通32核版本,以华东1(杭州)为例,每小时11.334元,性能更好。如需要更低规格,可以开通8核版本,以华东1(杭州)为例,每小时2.834元,注意8核仅用于体验,不适合用于生产。

4、选择您希望部署的LLM大模型和PAI-EAS部署大模型的实例规格。大模型选择通义千问-7b(开源)。如果已领取PAI-EAS免费试用权益,请选择试用活动分类下的ecs.gn7i-c8g1.2xlarge.limit机型,免费试用额度内无需付费。

5、PAI-EAS部署WebUI的实例规格。这里选择选择机型ecs.c7.2xlarge 8核16GB。

6、VPC配置,选择开启新建VPC。开启新建VPC会自动生成对应的专有网络VPC实例ID和交换机实例ID,在创建计算巢服务实例时,创建对应的VPC信息。如果不开启,这里就需要手动选择专有网络VPC实例ID和交换机实例ID信息。

其他配置保持默认,点击下一步:确认订单。在确认订单页面,确认订单费用后,选中我已阅读并同意《计算巢服务协议》,然后单击立即创建。

在依赖检查这里会发现一个异常,点击开通权限即可。

这里需要耐心等待部署完成。

部署过程中可以通过点击服务实例ID进入详情,通过日志管理可查看部署详情以及进度。

等待11分钟后,服务实例的状态变为已部署后,我们就可以开始使用知识库。

在服务实例详情页面,您可以获取到endpoint以访问服务,单击endpoint后面的链接。

接下来我们需要配置并连接知识库,在Hologres+大模型WebUI的设置页签,配置user和password。这里的user需要填入阿里云账号或RAM用户的AccessKey ID,AccessKey ID对应的AccessKey Secret。所以需要先创建一个AccessKey。

进入RAM控制台,点击创建AccessKey。

填入手机验证码,并复制保存好AccessKey。

将生成的AccessKey填入配置中并点击连接。

在连接信息中返回连接Hologres成功内容,即说明连接成功。

在上传页签,选择您的专属语料数据文件,然后单击上传。这里直接使用了官网提供的文件。

上传完成后在状态区域,返回“成功上传1个文件 [ example_data.txt, ] !”内容,即说明上传成功。

接下来就可以配置聊天相关的参数了,在聊天页签进行配置即可。

聊天模式有三种可选,他们的区别如下:

  • 向量数据库:使用您在Hologres中上传的语料数据进行向量近似查询问答。
  • 大语言模型:使用原始的预训练大语言模型进行问答。
  • 向量数据库+大语言模型:使用您在Hologres中上传的语料数据进行向量近似查询,然后通过大模型对查询结果进行进一步完善和调整,最终反馈优化后的结果。

完成配置后,我们就可以和模型进行对话了。如下:

输出结果

比如我输入“Hologres是啥”,“Hologres能做什么”,对话如下:

你可以对刚才的对话进行总结,直接点击总结按钮即可。

释放资源

完成体验后,非常且必要的一步就是将部署资源进行释放或者删除,以免产生不必要的费用扣除。操作如下:在服务实例管理页面的私有部署服务页签,找到您创建的Hologres+PAI一键部署企业级问答知识库服务服务实例,单击右侧操作列下的删除。

在您确定要删除当前服务实例吗对话框中,选中我确认删除服务实例及包含的云资源,单击确定删除。

该操作将一键清理掉部署所创建的所有资源,如果你需要保留,这一步操作需要慎重。

使用体验

通过上述部署体验,我总结如下:

  • 通过计算巢服务,可以一键完成Hologres与大规模问答知识库所需的硬件资源与软件资源部署,大大缩短了部署时间,提高了效率。PAI-EAS作为模型在线服务平台,支持用户将模型一键部署为在线推理服务或AI-Web应用,进一步简化了部署流程。
  • Hologres作为一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,能够处理PB级数据的多维分析和即席查询,满足企业级应用对数据处理能力的需求。PAI-EAS适用于实时推理、近实时异步推理等多种AI推理场景,具备自动扩缩容和完整运维监控体系等能力,确保系统的稳定性和可靠性。
  • LangChain是一个开源框架,可以将大模型、向量数据库、定制语料结合,高效完成专属问答知识库的搭建。Hologres现已被LangChain作为向量数据库集成,进一步丰富了问答知识库的功能。
  • 计算巢服务是一个开放给服务商和用户的服务管理PaaS平台,为服务商和用户提供了高效、便捷、安全的服务使用体验。用户可以根据业务需求灵活调整资源配置,实现资源的最大化利用。

除了上述的优点外,其实在体验中还能看到些许不足:

  • 企业级AI问答知识库的构建和运维需要投入大量的资金和资源。除了购买Hologres、PAI-EAS等产品的费用外,还需要考虑人员培训、系统维护、数据存储和传输等方面的成本。
  • 系统依赖于阿里云提供的Hologres、PAI-EAS和计算巢等外部服务,如果外部服务出现故障或中断,可能会对系统的正常运行造成影响。因此,用户需要关注外部服务的稳定性和可靠性,并制定相应的应急预案。
  • 上传语料数据文件耗时较长,官网提供的一个不到8kb的文件,上传硬是花费了2分钟。此外,号称5分钟的部署,实际耗时是11分钟。体验耗时就如此,那正式环境岂不是需要更久,非常期待后期优化。
  • 虽然一键部署简化了操作流程,但整个系统的构建和运维仍然需要较高的技术门槛。用户需要具备一定的云计算、大数据处理、AI算法等方面的知识和技能,才能充分发挥系统的全部优势。
相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
目录
相关文章
|
3天前
|
机器学习/深度学习 数据采集 人工智能
文档智能 & RAG 让AI大模型更懂业务 —— 阿里云LLM知识库解决方案评测
随着数字化转型的深入,企业对文档管理和知识提取的需求日益增长。阿里云推出的文档智能 & RAG(Retrieval-Augmented Generation)解决方案,通过高效的内容清洗、向量化处理、精准的问答召回和灵活的Prompt设计,帮助企业构建强大的LLM知识库,显著提升企业级文档管理的效率和准确性。
|
2月前
|
人工智能 自然语言处理 搜索推荐
最强AI写作助手,内置4o模型,引领AI智能问答的新纪元
随着人工智能技术的飞速进步,BKAI凭借其强大的GPT-4o模型,正在重新定义智能问答的标准。其中表现最强的AI助手神器:BKAI
|
6天前
|
人工智能
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
133 2
|
4天前
|
运维 安全 API
通义灵码知识库问答增强:知识库构建与管理指南
通义灵码能够结合企业知识库的私域数据,生成贴合企业特点的回答。充分发挥检索增强技术的优势,构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。
通义灵码知识库问答增强:知识库构建与管理指南
|
1月前
|
人工智能 JSON 数据格式
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
【9月更文挑战第6天】RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
|
16天前
|
人工智能 自然语言处理 数据挖掘
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
35 1
|
2月前
|
机器学习/深度学习 存储 自然语言处理
基于知识库快速搭建智能客服问答 Bot
在数字化转型的大潮中,智能客服系统成为提升企业客户体验与运营效率的关键工具。Botnow平台集成智能体创作与分发功能,提供一站式智能客服问答Bot搭建服务。本文详细介绍了如何利用Botnow的知识库功能及RAG(Retrieve-Augmented Generation)方案快速构建智能客服问答Bot。通过Botnow平台,用户可以轻松创建知识库、配置智能体,并关联知识库以实现智能回答。该方案广泛适用于对话沟通、行业知识库建设、企业内部信息检索及内容创作等多个场景。Botnow平台以其可视化编排、低技术门槛等特点,助力企业轻松实现智能客服系统的搭建与优化,成为数字化转型的重要推手。
123 1
|
2月前
|
开发框架 自然语言处理 API
基于RAG搭建企业级知识库在线问答
本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。
8260 17
|
2月前
|
机器学习/深度学习 人工智能 分布式计算
5分钟搭建企业级AI问答知识库
【8月更文挑战第14天】5分钟搭建企业级AI问答知识库
|
3月前
|
自然语言处理 前端开发 Go
5 大场景上手通义灵码企业知识库问答
通义灵码在企业版里还引入了一个超酷的新技能:RAG(Retrieval-Augmented Generation)检索增强生成的能力,本文就跟大家分享下企业知识库能帮开发者做些什么。
1089 13

热门文章

最新文章