手把手带你5分钟搭建企业级AI问答知识库

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 【8月更文挑战第3天】手把手带你5分钟搭建企业级AI问答知识库

配置过程

在正式开始本次体验前,我们需要进行一下环境的准备,比如确保已经拥有阿里云账号,并开通了Hologres、PAI-EAS(机器学习平台)和计算巢服务。下面就以如何开通人工智能平台PAI为例,阐述如何开通服务。

登录PAI控制台,如果你是首次使用PAI,会需要先开通个默认的工作空间。如下:

为了方便,这里地域就直接选择了杭州。如下:

由于本次体验不涉及其他服务,所以组合服务这里不需要勾选,以免产生不必要的费用。首次开通需要授权,点击授权前往RAM访问控制。如下:

点击同意授权即可。如下:

完成授权后返回点击刷新,继续点击“确认开通并创建默认工作空间”。如下:

这里需要等待一小会,即可完成服务的开通。如下:

这里需要注意的是,如果您已领取PAI-EAS免费试用权益,整个实验费用大约为每小时4.634元。如果您无免费试用额度或免费试用机型无库存,整个实验费用大约为每小时12.704元。

接着,我们前往计算巢控制台,在左侧导航栏,选择服务目录。

在搜索框中输入并搜索Hologres+PAI一键部署企业级问答知识库,在Hologres+PAI一键部署企业级问答知识库服务卡片下,单击正式创建。

在计算巢服务为第三方服务对话框中,选中我已阅读并同意《计算巢服务协议》,单击确定。

在创建服务实例页面,需要注意如下几点:

1、若已领取PAI-EAS免费试用权益,地域请您选择与开通PAI-EAS相同的地域。若无免费试用额度或免费试用机型无库存,可随意选择。

2、付费类型,可按需进行选择。但需要注意的是ECS和Hologres实例支持按量付费和包年包月,PAI-EAS实例只支持按量付费。

3、Hologres推荐开通32核版本,以华东1(杭州)为例,每小时11.334元,性能更好。如需要更低规格,可以开通8核版本,以华东1(杭州)为例,每小时2.834元,注意8核仅用于体验,不适合用于生产。

4、选择您希望部署的LLM大模型和PAI-EAS部署大模型的实例规格。大模型选择通义千问-7b(开源)。如果已领取PAI-EAS免费试用权益,请选择试用活动分类下的ecs.gn7i-c8g1.2xlarge.limit机型,免费试用额度内无需付费。

5、PAI-EAS部署WebUI的实例规格。这里选择选择机型ecs.c7.2xlarge 8核16GB。

6、VPC配置,选择开启新建VPC。开启新建VPC会自动生成对应的专有网络VPC实例ID和交换机实例ID,在创建计算巢服务实例时,创建对应的VPC信息。如果不开启,这里就需要手动选择专有网络VPC实例ID和交换机实例ID信息。

其他配置保持默认,点击下一步:确认订单。在确认订单页面,确认订单费用后,选中我已阅读并同意《计算巢服务协议》,然后单击立即创建。

在依赖检查这里会发现一个异常,点击开通权限即可。

这里需要耐心等待部署完成。

部署过程中可以通过点击服务实例ID进入详情,通过日志管理可查看部署详情以及进度。

等待11分钟后,服务实例的状态变为已部署后,我们就可以开始使用知识库。

在服务实例详情页面,您可以获取到endpoint以访问服务,单击endpoint后面的链接。

接下来我们需要配置并连接知识库,在Hologres+大模型WebUI的设置页签,配置user和password。这里的user需要填入阿里云账号或RAM用户的AccessKey ID,AccessKey ID对应的AccessKey Secret。所以需要先创建一个AccessKey。

进入RAM控制台,点击创建AccessKey。

填入手机验证码,并复制保存好AccessKey。

将生成的AccessKey填入配置中并点击连接。

在连接信息中返回连接Hologres成功内容,即说明连接成功。

在上传页签,选择您的专属语料数据文件,然后单击上传。这里直接使用了官网提供的文件。

上传完成后在状态区域,返回“成功上传1个文件 [ example_data.txt, ] !”内容,即说明上传成功。

接下来就可以配置聊天相关的参数了,在聊天页签进行配置即可。

聊天模式有三种可选,他们的区别如下:

  • 向量数据库:使用您在Hologres中上传的语料数据进行向量近似查询问答。
  • 大语言模型:使用原始的预训练大语言模型进行问答。
  • 向量数据库+大语言模型:使用您在Hologres中上传的语料数据进行向量近似查询,然后通过大模型对查询结果进行进一步完善和调整,最终反馈优化后的结果。

完成配置后,我们就可以和模型进行对话了。如下:

输出结果

比如我输入“Hologres是啥”,“Hologres能做什么”,对话如下:

你可以对刚才的对话进行总结,直接点击总结按钮即可。

释放资源

完成体验后,非常且必要的一步就是将部署资源进行释放或者删除,以免产生不必要的费用扣除。操作如下:在服务实例管理页面的私有部署服务页签,找到您创建的Hologres+PAI一键部署企业级问答知识库服务服务实例,单击右侧操作列下的删除。

在您确定要删除当前服务实例吗对话框中,选中我确认删除服务实例及包含的云资源,单击确定删除。

该操作将一键清理掉部署所创建的所有资源,如果你需要保留,这一步操作需要慎重。

使用体验

通过上述部署体验,我总结如下:

  • 通过计算巢服务,可以一键完成Hologres与大规模问答知识库所需的硬件资源与软件资源部署,大大缩短了部署时间,提高了效率。PAI-EAS作为模型在线服务平台,支持用户将模型一键部署为在线推理服务或AI-Web应用,进一步简化了部署流程。
  • Hologres作为一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,能够处理PB级数据的多维分析和即席查询,满足企业级应用对数据处理能力的需求。PAI-EAS适用于实时推理、近实时异步推理等多种AI推理场景,具备自动扩缩容和完整运维监控体系等能力,确保系统的稳定性和可靠性。
  • LangChain是一个开源框架,可以将大模型、向量数据库、定制语料结合,高效完成专属问答知识库的搭建。Hologres现已被LangChain作为向量数据库集成,进一步丰富了问答知识库的功能。
  • 计算巢服务是一个开放给服务商和用户的服务管理PaaS平台,为服务商和用户提供了高效、便捷、安全的服务使用体验。用户可以根据业务需求灵活调整资源配置,实现资源的最大化利用。

除了上述的优点外,其实在体验中还能看到些许不足:

  • 企业级AI问答知识库的构建和运维需要投入大量的资金和资源。除了购买Hologres、PAI-EAS等产品的费用外,还需要考虑人员培训、系统维护、数据存储和传输等方面的成本。
  • 系统依赖于阿里云提供的Hologres、PAI-EAS和计算巢等外部服务,如果外部服务出现故障或中断,可能会对系统的正常运行造成影响。因此,用户需要关注外部服务的稳定性和可靠性,并制定相应的应急预案。
  • 上传语料数据文件耗时较长,官网提供的一个不到8kb的文件,上传硬是花费了2分钟。此外,号称5分钟的部署,实际耗时是11分钟。体验耗时就如此,那正式环境岂不是需要更久,非常期待后期优化。
  • 虽然一键部署简化了操作流程,但整个系统的构建和运维仍然需要较高的技术门槛。用户需要具备一定的云计算、大数据处理、AI算法等方面的知识和技能,才能充分发挥系统的全部优势。
相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
目录
打赏
0
4
4
0
1708
分享
相关文章
重磅发布:VTJ.PRO 赋能若依(RuoYi)「AI + 低代码」能力,企业级开发效率跃升 300%
VTJ.PRO 与若依(RuoYi)深度集成,融合双向代码穿梭、AI智能引擎及多模态渲染技术,打造“设计即生产”新体验。支持可视化开发、AI生成代码、旧组件重构,提升企业开发效率,助力数字化转型。
149 29
企业级AI搜索解决方案:阿里云AI搜索开放平台
本文介绍了 阿里云 AI 搜索开放平台作提供丰富的 AI 搜索组件化服务,兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。
175 0
Dify+DeepSeek实战教程!企业级 AI 文档库本地化部署,数据安全与智能检索我都要
接下来这篇文章,就打算用最接地气的方式,手把手带你从 0 到 1 搭建一套专属的本地知识库系统。无论你是想优化企业内部文档检索(不用担心敏感数据上传云端的风险),还是像我一样想为用户打造更智能的文档服务,都能跟着步骤一步步实现。咱们不卖关子,直接上干货
Dify+DeepSeek实战教程!企业级 AI 文档库本地化部署,数据安全与智能检索我都要
三步法打造企业级AI产品,背后藏着怎样的落地方法论?
三桥君分享打造金融级AI产品的三步法:业务梳理找切入点、模型验证技术可行性、大规模验证落地效果。助力AI产品经理掌握核心能力,推动AI在信贷审批、投资管理等场景真正落地。
61 11
AI 智能客服搭建实战:如何建立一个企业级智能客服系统?
2025 年全球 AI 客服市场规模超 800 亿美元,企业面临意图识别误差、多语言支持等挑战。合力亿捷通过混合云架构、双引擎驱动等四层技术架构,结合小样本微调 + 主动学习等策略,实现服务效率提升 50% 以上、人工成本降低 40%,助力企业突破 “人工智障” 困境。
258 3
阿里云计算巢私有化MCP市场:企业级AI工具的安全部署新选择
阿里云计算巢私有化MCP市场,依托阿里云弹性计算资源,提供自主可控的私有化部署方案。支持OpenAPI、SSE、StreamableHttp等多种接入方式,结合Higress云原生网关实现高效网络控制,所有工具直接部署在用户云账号下,5分钟极速部署,保障数据安全与使用便捷性。适用于对数据安全要求高、需访问内网资源、服务隔离及统一管理多种MCP工具的企业场景。
智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
Spring AI Alibaba 发布企业级 MCP 分布式部署方案
本文介绍了Spring AI Alibaba MCP的开发与应用,旨在解决企业级AI Agent在分布式环境下的部署和动态更新问题。通过集成Nacos,Spring AI Alibaba实现了流量负载均衡及节点变更动态感知等功能。开发者可方便地将企业内部业务系统发布为MCP服务或开发自己的AI Agent。文章详细描述了如何通过代理应用接入存量业务系统,以及全新MCP服务的开发流程,并提供了完整的配置示例和源码链接。未来,Spring AI Alibaba计划结合Nacos3的mcp-registry与mcp-router能力,进一步优化Agent开发体验。
1233 14
AI助理
登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问

你好,我是AI助理

可以解答问题、推荐解决方案等