使用ASK容器化部署大语言模型FastChat

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: 本实验指导您在容器服务Serverless版(以下简称 ASK)中,容器化部署大语言模型FastChat。

使用ASK容器化部署大语言模型FastChat


1. 计费说明

必看!!必看!!必看!!

本实验为付费体验,需要消耗账号费用。体验后若不再需要使用,请及时释放资源,避免持续产生费用。

计费说明

完成本实验,将要耗费 ACK Serverless Pro 集群的相关云资源费用说明如下。更多信息,请参见 ACK Serverless集群计费说明

产品名

计费类型

费用

计费链接

容器服务ACK Serverless Pro集群

限时免费

目前公测中,限时免费

ACK Serverless集群计费说明

弹性容器实例

按量付费

11.74元/小时~15.46元/小时

ECI实例计费

NAT网关

按量付费

0.78元/小时

NAT计费概述

负载均衡CLB

按量付费

0.32元/小时

CLB按量付费

2. 创建 ACK Serverless Pro 版集群

  1. 登录容器服务管理控制台,在左侧导航栏选择集群
  2. 集群列表页面,单击页面右上角的创建集群

  1. 创建集群页面的集群配置中,单击ACK Serverless 集群,根据如下参数说明完成相关配置,其他配置项保持默认值,然后单击下一步:组件配置

配置项

说明

示例值

集群名称

填写集群的名称。

fastchat-demo

集群规格

选择集群规格,支持 Pro 版标准版

Pro 版

地域

选择集群所在的地域。建议选择华北2(北京)地域

华北2(北京)

API Server 访问

ACK Serverless 默认为 API Server 创建一个内网 SLB 实例,您可修改 SLB实 例规格。更多信息,请参见实例规格

您可设置是否开放使用 EIP 暴露 API Server

选中

  1. 组件配置中,配置项保持默认,完成组件配置,单击下一步:确认配置。如您无需使用日志服务功能,可以取消选中使用日志服务,避免产生相关费用。

  1. 确认配置中,确认配置信息,仔细阅读并选中服务协议,单击创建集群

请您耐心等待大约3~5分钟,返回如下结果表示集群创建成功。

3. 创建 FastChat 应用

  1. 集群列表页面,单击集群名称fastchat-demo进入集群信息页面,然后在左侧导航栏,选择工作负载 > 无状态

  1. 无状态页面,单击使用YAML创建资源。

  1. 示例模板下拉列表中,选择自定义,将如下 fastchat 应用的 YAML 示例粘贴至模板,然后单击创建
apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    app: fastchat
  name: fastchat
  namespace: default
spec:
  replicas: 1
  selector:
    matchLabels:
      app: fastchat
  template:
    metadata:
      labels:
        app: fastchat
        alibabacloud.com/eci: "true" 
      annotations:
        k8s.aliyun.com/eci-use-specs: ecs.gn6i-c8g1.2xlarge,ecs.gn5-c8g1.2xlarge,ecs.gn6v-c8g1.8xlarge,ecs.gn6i-c16g1.4xlarge
        k8s.aliyun.com/eci-extra-ephemeral-storage: 100Gi
    spec:
      dnsPolicy: Default
      containers:
      - command:
        - sh
        - -c 
        - "/root/webui.sh"
        image: yunqi-registry.cn-shanghai.cr.aliyuncs.com/lab/fastchat:v1.1.0
        imagePullPolicy: IfNotPresent
        name: fastchat
        ports:
        - containerPort: 7860
          protocol: TCP
        readinessProbe:
          failureThreshold: 3
          initialDelaySeconds: 5
          periodSeconds: 10
          successThreshold: 1
          tcpSocket:
            port: 7860
          timeoutSeconds: 1
        resources:
          requests:
            cpu: "8"
            memory: 16Gi
          limits:
            nvidia.com/gpu: 1
---
apiVersion: v1
kind: Service
metadata:
  annotations:
    service.beta.kubernetes.io/alibaba-cloud-loadbalancer-address-type: internet
    service.beta.kubernetes.io/alibaba-cloud-loadbalancer-instance-charge-type: PayByCLCU
  name: fastchat
  namespace: default
spec:
  externalTrafficPolicy: Local
  ports:
  - port: 7860
    protocol: TCP
    targetPort: 7860
  selector:
    app: fastchat
  type: LoadBalancer

  1. 创建页面下方,单击fastchat,查看应用创建进度。

等待Pod状态变为Running,表示fastchat应用部署完成。

4. 访问 FastChat 服务

注意事项

  • fastchat-t5-3b-v1.0模型仅支持日常对话,不支持代码生成等高级功能。
  • 仅支持英文

访问步骤

  1. 在左侧导航栏,选择网络>服务,查看您创建的服务fastchat的外部端点,例如8.140.XX.XX:7860。

  1. 在您的本机浏览器中输入http://8.140.XX.XX:7860,访问和体验fastchat应用。

通过输入问题,然后单击Send,即可体验大语言模型FastChat的聊天功能。

5. 释放资源

必看!!必看!!必看!!

本实验为付费体验,需要消耗账号费用。体验后若不再需要使用,请及时释放资源,避免持续产生费用。

ACK Serverless Pro集群目前处于公测中,可免费试用。但是在使用ACK Serverless Pro集群过程中用到的其他阿里云云产品资源,您需要按照各云产品规定的计费规则,为您使用的资源付费,费用由各云产品收取。体验完成后,请参考以下场景处理集群:

  • 如您需要继续使用集群,请确保账户金额不小于100.00元人民币。在使用ACK Serverless Pro版集群过程中用到的其他阿里云云产品资源,相关计费说明,请参见云产品资源计费
  • 如您不需要继续使用ACK Serverless Pro集群,请按照如下步骤释放资源,避免产生资损。

释放容器服务ACK Serverless Pro集群

  1. 集群列表页面,找到您已创建的ACK Serverless Pro集群,在右侧操作列,选择更多>删除

  1. 删除集群面板中,选中同时删除集群下的ALB资源同时删除集群下的PrivateZone资源我已知晓以上信息并确认删除集群,然后单击确定。

说明:等待大约3~5分钟,ACK Serverless Pro集群即可删除成功。

  1. 输入手机验证码,然后单击确定,ACK Serverless Pro集群删除完成。

释放NAT网关

  1. 登录NAT网关管理控制台
  2. 在左侧导航栏,选择NAT网关>公网 NAT 网关。

  1. 公网NAT网关页面顶部,选择网关所在地域华北2(北京),然后在页面右侧的操作列,单击图标,然后单击删除。

  1. 删除网关面板中,选中强制删除(删除 NAT 网关及其包含资源),然后单击确定,NAT 网关删除完成。

释放负载均衡 CLB

  1. 登录传统型负载负载均衡CLB控制台
  2. 实例管理页面顶部,选择实例所在地域华北2(北京),单击目标实例ID进入实例详情页面。

  1. 实例详情页面,单击关闭 删除保护以关闭删除保护开关。

  1. 返回实例管理页面,单击图标,然后单击释放设置

  1. 释放设置页面,选中立即释放,单击下一步,然后单击确定完成实例释放。

实验地址:https://developer.aliyun.com/adc/scenario/d768d6c9b5ab4bcdb670d75694ca54f0

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
3月前
|
运维 Kubernetes 监控
容器服务ASK初评
【8月更文挑战第12天】容器服务ASK初评
163 2
|
开发者 流计算
《开发者评测》之容器服务ASK获奖名单
容器服务ASK评测活动获奖名单出炉啦!
695 0
|
运维 Kubernetes 持续交付
容器服务ASK-阿里云产品评测
容器服务ASK-阿里云产品评测
176 1
|
运维 Kubernetes 开发者
全面升级,重磅上线!容器服务ASK评测携大奖前来!
重磅新品优先体验,免费领取试用额度,更有多重奖品,还不快来!
1264 0
|
Kubernetes Serverless 容器
使用ASK创建容器组,在ECI控制台查看
使用ASK创建容器组,在ECI控制台查看
138 0
使用ASK创建容器组,在ECI控制台查看
|
消息中间件 弹性计算 Kubernetes
基于 ASK + EB 构建容器事件驱动服务
本篇文章以“在线文件解压场景”为例为大家展示经典 EDA 事件驱动与容器如何搭配使用。
基于 ASK + EB 构建容器事件驱动服务
|
7天前
|
Kubernetes Cloud Native Docker
云原生时代的容器化实践:Docker和Kubernetes入门
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术成为企业提升敏捷性和效率的关键。本篇文章将引导读者了解如何利用Docker进行容器化打包及部署,以及Kubernetes集群管理的基础操作,帮助初学者快速入门云原生的世界。通过实际案例分析,我们将深入探讨这些技术在现代IT架构中的应用与影响。
30 2
|
17天前
|
Kubernetes 监控 开发者
掌握容器化:Docker与Kubernetes的最佳实践
【10月更文挑战第26天】本文深入探讨了Docker和Kubernetes的最佳实践,涵盖Dockerfile优化、数据卷管理、网络配置、Pod设计、服务发现与负载均衡、声明式更新等内容。同时介绍了容器化现有应用、自动化部署、监控与日志等开发技巧,以及Docker Compose和Helm等实用工具。旨在帮助开发者提高开发效率和系统稳定性,构建现代、高效、可扩展的应用。
|
13天前
|
关系型数据库 MySQL API
|
6天前
|
缓存 监控 开发者
掌握Docker容器化技术:提升开发效率的利器
在现代软件开发中,Docker容器化技术成为提升开发效率和应用部署灵活性的重要工具。本文介绍Docker的基本概念,并分享Dockerfile最佳实践、容器网络配置、环境变量和秘密管理、容器监控与日志管理、Docker Compose以及CI/CD集成等技巧,帮助开发者更高效地利用Docker。