操作手册
云产品资源
实践记录

操作手册

ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。

场景简介

本场景将提供一台配置了Alibaba Cloud Linux 3操作系统的GPU实例。通过本教程的操作,您可以在一台Alibaba Cloud Linux 3的GPU云服务器上,安装大模型运行环境(包括Anaconda、Pytorch等的),部署大语言模型,使用streamlit运行大模型对话模型网页demo。

背景知识

本场景主要涉及以下云产品和服务:

  • GPU云服务器

    GPU 云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚太第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力。

  • ChatGLB2-6B大模型

    由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。截至2023年7月,在C-Eval中,排名靠前。

  • Pytorch

    一个开源的Python机器学习库,基于Torch,底层由C++实现,应用于人工智能领域,如计算机视觉和自然语言处理。它主要由Meta Platforms的人工智能研究团队开发。著名的用途有:特斯拉自动驾驶,Uber最初发起而现属Linux基金会项目的概率编程软件Pyro,Lightning。注:来源 -维基百科。

目录
上一步
下一步

【实践】在云上部署ChatGLM2-6B大模型(GPU版)

资源开通说明

• 进入实操前,请确保您已通过 实名认证 账户余额 大于100元

• 资源开通在个人账号,默认时长180分钟

• 云资源产生的费用需您自行承担,云起实践平台不会向您征收额外费用

• 实操结束后,您可以选择继续付费保留资源,或参考手册自动/手动释放资源

包含云产品资源(4个):
云服务器 ECS
按量付费
ecs.gn6i-c4g1.xlarge,4vCPU15GiB,90G ESSD
专有网络VPC
IPV4网段:172.16.0.0/12
云服务器 ECS
VSwitch
云服务器 ECS
安全组
实践费用预估费用明细
11.82 起 / 1小时、按流量费用¥0.8/GB
(最终费用将按实际云资源消耗计算)
请先阅读并同意服务协议
本区域为操作区,您可以边阅读左侧操作手册,边进行实操。
云控制台
Cloud Shell