使用ASK容器化部署大语言模型FastChat

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 本实验指导您在容器服务Serverless版(以下简称 ASK)中,容器化部署大语言模型FastChat。

使用ASK容器化部署大语言模型FastChat


1. 计费说明

必看!!必看!!必看!!

本实验为付费体验,需要消耗账号费用。体验后若不再需要使用,请及时释放资源,避免持续产生费用。

计费说明

完成本实验,将要耗费 ACK Serverless Pro 集群的相关云资源费用说明如下。更多信息,请参见 ACK Serverless集群计费说明

产品名

计费类型

费用

计费链接

容器服务ACK Serverless Pro集群

限时免费

目前公测中,限时免费

ACK Serverless集群计费说明

弹性容器实例

按量付费

11.74元/小时~15.46元/小时

ECI实例计费

NAT网关

按量付费

0.78元/小时

NAT计费概述

负载均衡CLB

按量付费

0.32元/小时

CLB按量付费

2. 创建 ACK Serverless Pro 版集群

  1. 登录容器服务管理控制台,在左侧导航栏选择集群
  2. 集群列表页面,单击页面右上角的创建集群

  1. 创建集群页面的集群配置中,单击ACK Serverless 集群,根据如下参数说明完成相关配置,其他配置项保持默认值,然后单击下一步:组件配置

配置项

说明

示例值

集群名称

填写集群的名称。

fastchat-demo

集群规格

选择集群规格,支持 Pro 版标准版

Pro 版

地域

选择集群所在的地域。建议选择华北2(北京)地域

华北2(北京)

API Server 访问

ACK Serverless 默认为 API Server 创建一个内网 SLB 实例,您可修改 SLB实 例规格。更多信息,请参见实例规格

您可设置是否开放使用 EIP 暴露 API Server

选中

  1. 组件配置中,配置项保持默认,完成组件配置,单击下一步:确认配置。如您无需使用日志服务功能,可以取消选中使用日志服务,避免产生相关费用。

  1. 确认配置中,确认配置信息,仔细阅读并选中服务协议,单击创建集群

请您耐心等待大约3~5分钟,返回如下结果表示集群创建成功。

3. 创建 FastChat 应用

  1. 集群列表页面,单击集群名称fastchat-demo进入集群信息页面,然后在左侧导航栏,选择工作负载 > 无状态

  1. 无状态页面,单击使用YAML创建资源。

  1. 示例模板下拉列表中,选择自定义,将如下 fastchat 应用的 YAML 示例粘贴至模板,然后单击创建
apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    app: fastchat
  name: fastchat
  namespace: default
spec:
  replicas: 1
  selector:
    matchLabels:
      app: fastchat
  template:
    metadata:
      labels:
        app: fastchat
        alibabacloud.com/eci: "true" 
      annotations:
        k8s.aliyun.com/eci-use-specs: ecs.gn6i-c8g1.2xlarge,ecs.gn5-c8g1.2xlarge,ecs.gn6v-c8g1.8xlarge,ecs.gn6i-c16g1.4xlarge
        k8s.aliyun.com/eci-extra-ephemeral-storage: 100Gi
    spec:
      dnsPolicy: Default
      containers:
      - command:
        - sh
        - -c 
        - "/root/webui.sh"
        image: yunqi-registry.cn-shanghai.cr.aliyuncs.com/lab/fastchat:v1.1.0
        imagePullPolicy: IfNotPresent
        name: fastchat
        ports:
        - containerPort: 7860
          protocol: TCP
        readinessProbe:
          failureThreshold: 3
          initialDelaySeconds: 5
          periodSeconds: 10
          successThreshold: 1
          tcpSocket:
            port: 7860
          timeoutSeconds: 1
        resources:
          requests:
            cpu: "8"
            memory: 16Gi
          limits:
            nvidia.com/gpu: 1
---
apiVersion: v1
kind: Service
metadata:
  annotations:
    service.beta.kubernetes.io/alibaba-cloud-loadbalancer-address-type: internet
    service.beta.kubernetes.io/alibaba-cloud-loadbalancer-instance-charge-type: PayByCLCU
  name: fastchat
  namespace: default
spec:
  externalTrafficPolicy: Local
  ports:
  - port: 7860
    protocol: TCP
    targetPort: 7860
  selector:
    app: fastchat
  type: LoadBalancer

  1. 创建页面下方,单击fastchat,查看应用创建进度。

等待Pod状态变为Running,表示fastchat应用部署完成。

4. 访问 FastChat 服务

注意事项

  • fastchat-t5-3b-v1.0模型仅支持日常对话,不支持代码生成等高级功能。
  • 仅支持英文

访问步骤

  1. 在左侧导航栏,选择网络>服务,查看您创建的服务fastchat的外部端点,例如8.140.XX.XX:7860。

  1. 在您的本机浏览器中输入http://8.140.XX.XX:7860,访问和体验fastchat应用。

通过输入问题,然后单击Send,即可体验大语言模型FastChat的聊天功能。

5. 释放资源

必看!!必看!!必看!!

本实验为付费体验,需要消耗账号费用。体验后若不再需要使用,请及时释放资源,避免持续产生费用。

ACK Serverless Pro集群目前处于公测中,可免费试用。但是在使用ACK Serverless Pro集群过程中用到的其他阿里云云产品资源,您需要按照各云产品规定的计费规则,为您使用的资源付费,费用由各云产品收取。体验完成后,请参考以下场景处理集群:

  • 如您需要继续使用集群,请确保账户金额不小于100.00元人民币。在使用ACK Serverless Pro版集群过程中用到的其他阿里云云产品资源,相关计费说明,请参见云产品资源计费
  • 如您不需要继续使用ACK Serverless Pro集群,请按照如下步骤释放资源,避免产生资损。

释放容器服务ACK Serverless Pro集群

  1. 集群列表页面,找到您已创建的ACK Serverless Pro集群,在右侧操作列,选择更多>删除

  1. 删除集群面板中,选中同时删除集群下的ALB资源同时删除集群下的PrivateZone资源我已知晓以上信息并确认删除集群,然后单击确定。

说明:等待大约3~5分钟,ACK Serverless Pro集群即可删除成功。

  1. 输入手机验证码,然后单击确定,ACK Serverless Pro集群删除完成。

释放NAT网关

  1. 登录NAT网关管理控制台
  2. 在左侧导航栏,选择NAT网关>公网 NAT 网关。

  1. 公网NAT网关页面顶部,选择网关所在地域华北2(北京),然后在页面右侧的操作列,单击图标,然后单击删除。

  1. 删除网关面板中,选中强制删除(删除 NAT 网关及其包含资源),然后单击确定,NAT 网关删除完成。

释放负载均衡 CLB

  1. 登录传统型负载负载均衡CLB控制台
  2. 实例管理页面顶部,选择实例所在地域华北2(北京),单击目标实例ID进入实例详情页面。

  1. 实例详情页面,单击关闭 删除保护以关闭删除保护开关。

  1. 返回实例管理页面,单击图标,然后单击释放设置

  1. 释放设置页面,选中立即释放,单击下一步,然后单击确定完成实例释放。

实验地址:https://developer.aliyun.com/adc/scenario/d768d6c9b5ab4bcdb670d75694ca54f0

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
1月前
|
Kubernetes Docker Python
Docker 与 Kubernetes 容器化部署核心技术及企业级应用实践全方案解析
本文详解Docker与Kubernetes容器化技术,涵盖概念原理、环境搭建、镜像构建、应用部署及监控扩展,助你掌握企业级容器化方案,提升应用开发与运维效率。
445 108
|
1月前
|
运维 监控 数据可视化
小白也能部署应用,3个免费的容器化部署工具测评
本文对比了三款容器化部署工具:Docker Compose、Portainer 和 Websoft9。Docker Compose 适合开发者编排多容器应用,Portainer 提供图形化管理界面,而 Websoft9 则面向中小企业和非技术人员,提供一键部署与全流程运维支持,真正实现“开箱即用”。三款工具各有定位,Websoft9 更贴近大众用户需求。
小白也能部署应用,3个免费的容器化部署工具测评
|
3月前
|
运维 监控 数据可视化
容器化部署革命:Docker实战指南
容器化部署革命:Docker实战指南
|
3月前
|
存储 运维 安全
Docker化运维:容器部署的实践指南
Docker化运维:容器部署的实践指南
|
1月前
|
运维 数据可视化 C++
2025 热门的 Web 化容器部署工具对比:Portainer VS Websoft9
2025年热门Web化容器部署工具对比:Portainer与Websoft9。Portainer以轻量可视化管理见长,适合技术团队运维;Websoft9则提供一站式应用部署与容器管理,内置丰富开源模板,降低中小企业部署门槛。两者各有优势,助力企业提升容器化效率。
190 1
2025 热门的 Web 化容器部署工具对比:Portainer VS Websoft9
|
7月前
|
应用服务中间件 PHP nginx
今日小结通过aliyun的本地容器镜像部署我的nginx和php环境
简介: 本教程介绍如何基于 Dragonwell 的 Ubuntu 镜像创建一个运行 Nginx 的 Docker 容器。首先从阿里云容器镜像服务拉取基础镜像,然后编写 Dockerfile 确保 Nginx 作为主进程运行,并暴露 80 端口。最后,在包含 Dockerfile 的目录下构建自定义镜像并启动容器,确保 Nginx 在前台运行,避免容器启动后立即退出。通过 `docker build` 和 `docker run` 命令完成整个流程。
285 25
今日小结通过aliyun的本地容器镜像部署我的nginx和php环境
|
7月前
|
人工智能 Kubernetes jenkins
容器化AI模型的持续集成与持续交付(CI/CD):自动化模型更新与部署
在前几篇文章中,我们探讨了容器化AI模型的部署、监控、弹性伸缩及安全防护。为加速模型迭代以适应新数据和业务需求,需实现容器化AI模型的持续集成与持续交付(CI/CD)。CI/CD通过自动化构建、测试和部署流程,提高模型更新速度和质量,降低部署风险,增强团队协作。使用Jenkins和Kubernetes可构建高效CI/CD流水线,自动化模型开发和部署,确保环境一致性并提升整体效率。
|
4月前
|
关系型数据库 MySQL 数据库
【赵渝强老师】数据库不适合Docker容器化部署的原因
本文介绍了在Docker中部署MySQL数据库并实现数据持久化的方法,同时分析了数据库不适合容器化的原因。通过具体步骤演示如何拉取镜像、创建持久化目录及启动容器,确保数据安全存储。然而,由于数据安全性、硬件资源争用、网络带宽限制及额外隔离层等问题,数据库服务并不完全适合Docker容器化部署。文中还提到数据库一旦部署通常无需频繁升级,与Docker易于重构和重新部署的特点不符。
288 18
【赵渝强老师】数据库不适合Docker容器化部署的原因