想用modelscope的百川7B chat1模型构建dialogue agent配置文件该怎样写?

想使用modelscope的百川7B chat1模型构建dialogue agent配置文件该怎样写?

展开
收起
小小爱吃香菜 2024-04-09 18:35:40 38 分享 版权
阿里云 AI 助理回答

要使用ModelScope的百川7B-Chat模型(baichuan-inc/Baichuan2-7B-Chat)构建一个对话代理(dialogue agent),需要根据提供的知识库资料,配置相关参数。以下是详细的配置文件和步骤说明:


1. 配置文件内容

以下是一个典型的配置文件示例,用于部署百川7B-Chat模型作为对话代理服务:

# 服务名称
service_name: baichuan_7b_chat_agent

# 部署方式
deployment_mode: custom

# 镜像配置
image:
  type: official
  name: modelscope-inference
  version: latest

# 环境变量
environment_variables:
  - name: MODEL_ID
    value: baichuan-inc/Baichuan2-7B-Chat
  - name: TASK
    value: chat
  - name: REVISION
    value: v1.0.0  # 根据实际模型版本填写<sup>[1]</sup>
  - name: ACCESS_TOKEN
    value: your_sdk_access_token  # 如果模型为非公开模型,需配置访问令牌<sup>[1]</sup>

# 运行命令
command: python app.py

# 资源配置
resources:
  instance_type: ml.gu7i.c16m60.1-gu30  # 推荐GPU资源规格<sup>[1]</sup>
  system_disk_size: 100  # 单位:GB

# 端口号
port: 8000

2. 参数详解

2.1 服务名称

  • 字段: service_name
  • 描述: 自定义的服务名称,便于在控制台中识别。
  • 示例值: baichuan_7b_chat_agent

2.2 部署方式

  • 字段: deployment_mode
  • 描述: 指定为自定义部署模式(custom),并开启Web应用支持。

2.3 镜像配置

  • 字段: image
  • 描述: 使用官方镜像modelscope-inference,并选择最新版本。
  • 推荐版本: latest

2.4 环境变量

  • 字段: environment_variables
  • 描述: 配置模型运行所需的环境变量。
    • MODEL_ID: 模型ID,指定为baichuan-inc/Baichuan2-7B-Chat
    • TASK: 模型任务类型,对话模型统一为chat
    • REVISION: 模型版本号,需根据实际模型版本填写(如v1.0.0)。
    • ACCESS_TOKEN(可选): 如果模型为非公开模型,需配置SDK访问令牌。

2.5 运行命令

  • 字段: command
  • 描述: 指定运行命令,默认为python app.py

2.6 资源配置

  • 字段: resources
  • 描述: 配置实例规格和系统盘大小。
    • instance_type: 推荐使用ml.gu7i.c16m60.1-gu30,适用于7B模型的GPU资源。
    • system_disk_size: 系统盘大小,建议设置为100GB。

2.7 端口号

  • 字段: port
  • 描述: 指定服务监听的端口号,默认为8000

3. 部署步骤

3.1 登录PAI控制台

  1. 登录阿里云PAI控制台。
  2. 在页面上方选择目标地域,并在右侧选择目标工作空间。
  3. 单击进入EAS

3.2 部署服务

  1. 单击部署服务,然后在自定义模型部署区域,单击自定义部署
  2. 自定义部署页面,按照上述配置文件填写关键参数。
  3. 单击部署,等待服务状态变为运行中

4. 调用服务

4.1 API调用

  • 请求格式:
    {
    "prompt": "你好,介绍一下杭州。",
    "model": "baichuan2-7b-chat-v1"
    }
    
  • 返回结果:
    {
    "status_code": 200,
    "request_id": "dcb8fe29-6b2a-9797-8e35-f81b4aa7b33c",
    "output": {
      "text": "杭州是中国浙江省的省会城市,以其美丽的西湖、悠久的历史文化和现代化的城市发展而闻名。..."
    }
    }
    

4.2 WebUI调用

  1. 服务部署成功后,单击服务方式列下的查看Web应用
  2. 在WebUI页面左侧输入测试内容,单击执行测试,查看返回结果。

5. 注意事项

  • 模型版本: 确保REVISION字段与实际模型版本一致,避免因版本不匹配导致服务异常。
  • 资源选择: 百川7B模型对GPU资源要求较高,建议选择ml.gu7i.c16m60.1-gu30或更高规格的GPU实例。
  • 访问令牌: 如果模型为非公开模型,务必配置正确的ACCESS_TOKEN,否则无法加载模型。

通过以上配置和步骤,您可以成功使用ModelScope的百川7B-Chat模型构建一个对话代理服务。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理