配置过程
在正式开始本次体验前,我们需要进行一下环境的准备,比如确保已经拥有阿里云账号,并开通了Hologres、PAI-EAS(机器学习平台)和计算巢服务。下面就以如何开通人工智能平台PAI为例,阐述如何开通服务。
登录PAI控制台,如果你是首次使用PAI,会需要先开通个默认的工作空间。如下:
为了方便,这里地域就直接选择了杭州。如下:
由于本次体验不涉及其他服务,所以组合服务这里不需要勾选,以免产生不必要的费用。首次开通需要授权,点击授权前往RAM访问控制。如下:
点击同意授权即可。如下:
完成授权后返回点击刷新,继续点击“确认开通并创建默认工作空间”。如下:
这里需要等待一小会,即可完成服务的开通。如下:
这里需要注意的是,如果您已领取PAI-EAS免费试用权益,整个实验费用大约为每小时4.634元。如果您无免费试用额度或免费试用机型无库存,整个实验费用大约为每小时12.704元。
接着,我们前往计算巢控制台,在左侧导航栏,选择服务目录。
在搜索框中输入并搜索Hologres+PAI一键部署企业级问答知识库,在Hologres+PAI一键部署企业级问答知识库服务卡片下,单击正式创建。
在计算巢服务为第三方服务对话框中,选中我已阅读并同意《计算巢服务协议》,单击确定。
在创建服务实例页面,需要注意如下几点:
1、若已领取PAI-EAS免费试用权益,地域请您选择与开通PAI-EAS相同的地域。若无免费试用额度或免费试用机型无库存,可随意选择。
2、付费类型,可按需进行选择。但需要注意的是ECS和Hologres实例支持按量付费和包年包月,PAI-EAS实例只支持按量付费。
3、Hologres推荐开通32核版本,以华东1(杭州)为例,每小时11.334元,性能更好。如需要更低规格,可以开通8核版本,以华东1(杭州)为例,每小时2.834元,注意8核仅用于体验,不适合用于生产。
4、选择您希望部署的LLM大模型和PAI-EAS部署大模型的实例规格。大模型选择通义千问-7b(开源)。如果已领取PAI-EAS免费试用权益,请选择试用活动分类下的ecs.gn7i-c8g1.2xlarge.limit机型,免费试用额度内无需付费。
5、PAI-EAS部署WebUI的实例规格。这里选择选择机型ecs.c7.2xlarge 8核16GB。
6、VPC配置,选择开启新建VPC。开启新建VPC会自动生成对应的专有网络VPC实例ID和交换机实例ID,在创建计算巢服务实例时,创建对应的VPC信息。如果不开启,这里就需要手动选择专有网络VPC实例ID和交换机实例ID信息。
其他配置保持默认,点击下一步:确认订单。在确认订单页面,确认订单费用后,选中我已阅读并同意《计算巢服务协议》,然后单击立即创建。
在依赖检查这里会发现一个异常,点击开通权限即可。
这里需要耐心等待部署完成。
部署过程中可以通过点击服务实例ID进入详情,通过日志管理可查看部署详情以及进度。
等待11分钟后,服务实例的状态变为已部署后,我们就可以开始使用知识库。
在服务实例详情页面,您可以获取到endpoint以访问服务,单击endpoint后面的链接。
接下来我们需要配置并连接知识库,在Hologres+大模型WebUI的设置页签,配置user和password。这里的user需要填入阿里云账号或RAM用户的AccessKey ID,AccessKey ID对应的AccessKey Secret。所以需要先创建一个AccessKey。
进入RAM控制台,点击创建AccessKey。
填入手机验证码,并复制保存好AccessKey。
将生成的AccessKey填入配置中并点击连接。
在连接信息中返回连接Hologres成功内容,即说明连接成功。
在上传页签,选择您的专属语料数据文件,然后单击上传。这里直接使用了官网提供的文件。
上传完成后在状态区域,返回“成功上传1个文件 [ example_data.txt, ] !”内容,即说明上传成功。
接下来就可以配置聊天相关的参数了,在聊天页签进行配置即可。
聊天模式有三种可选,他们的区别如下:
- 向量数据库:使用您在Hologres中上传的语料数据进行向量近似查询问答。
- 大语言模型:使用原始的预训练大语言模型进行问答。
- 向量数据库+大语言模型:使用您在Hologres中上传的语料数据进行向量近似查询,然后通过大模型对查询结果进行进一步完善和调整,最终反馈优化后的结果。
完成配置后,我们就可以和模型进行对话了。如下:
输出结果
比如我输入“Hologres是啥”,“Hologres能做什么”,对话如下:
你可以对刚才的对话进行总结,直接点击总结按钮即可。
释放资源
完成体验后,非常且必要的一步就是将部署资源进行释放或者删除,以免产生不必要的费用扣除。操作如下:在服务实例管理页面的私有部署服务页签,找到您创建的Hologres+PAI一键部署企业级问答知识库服务服务实例,单击右侧操作列下的删除。
在您确定要删除当前服务实例吗对话框中,选中我确认删除服务实例及包含的云资源,单击确定删除。
该操作将一键清理掉部署所创建的所有资源,如果你需要保留,这一步操作需要慎重。
使用体验
通过上述部署体验,我总结如下:
- 通过计算巢服务,可以一键完成Hologres与大规模问答知识库所需的硬件资源与软件资源部署,大大缩短了部署时间,提高了效率。PAI-EAS作为模型在线服务平台,支持用户将模型一键部署为在线推理服务或AI-Web应用,进一步简化了部署流程。
- Hologres作为一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,能够处理PB级数据的多维分析和即席查询,满足企业级应用对数据处理能力的需求。PAI-EAS适用于实时推理、近实时异步推理等多种AI推理场景,具备自动扩缩容和完整运维监控体系等能力,确保系统的稳定性和可靠性。
- LangChain是一个开源框架,可以将大模型、向量数据库、定制语料结合,高效完成专属问答知识库的搭建。Hologres现已被LangChain作为向量数据库集成,进一步丰富了问答知识库的功能。
- 计算巢服务是一个开放给服务商和用户的服务管理PaaS平台,为服务商和用户提供了高效、便捷、安全的服务使用体验。用户可以根据业务需求灵活调整资源配置,实现资源的最大化利用。
除了上述的优点外,其实在体验中还能看到些许不足:
- 企业级AI问答知识库的构建和运维需要投入大量的资金和资源。除了购买Hologres、PAI-EAS等产品的费用外,还需要考虑人员培训、系统维护、数据存储和传输等方面的成本。
- 系统依赖于阿里云提供的Hologres、PAI-EAS和计算巢等外部服务,如果外部服务出现故障或中断,可能会对系统的正常运行造成影响。因此,用户需要关注外部服务的稳定性和可靠性,并制定相应的应急预案。
- 上传语料数据文件耗时较长,官网提供的一个不到8kb的文件,上传硬是花费了2分钟。此外,号称5分钟的部署,实际耗时是11分钟。体验耗时就如此,那正式环境岂不是需要更久,非常期待后期优化。
- 虽然一键部署简化了操作流程,但整个系统的构建和运维仍然需要较高的技术门槛。用户需要具备一定的云计算、大数据处理、AI算法等方面的知识和技能,才能充分发挥系统的全部优势。