ModelScope模型部署的问题,模型在notebook能跑起来了,怎么部署成支持api的型式?
要将已经在Notebook中成功运行的ModelScope模型部署为支持API调用的形式,您可以按照以下步骤操作。此过程主要通过阿里云的人工智能平台PAI(EAS)完成。
在开始部署之前,请确保以下条件已满足: 1. 您已经登录到阿里云控制台,并具备访问PAI-EAS服务的权限。 2. 您已在ModelScope社区中选择并确认了需要部署的模型(例如普通Pipeline模型或大语言对话模型)。 3. 如果是私有模型,您需要提前获取访问令牌(ACCESS_TOKEN),以便在部署时配置环境变量。
进入EAS控制台
选择ModelScope模型部署
配置关键参数
modelscope-inference,并使用最新版本。MODEL_ID: iic/nlp_csanmt_translation_en2zh
TASK: translation
REVISION: v1.0.1
MODEL_ID: ZhipuAI/chatglm2-6b
TASK: chat
REVISION: v1.0.11
ACCESS_TOKEN: <您的SDK访问令牌>
ml.gu7i.c16m60.1-gu30)。启动部署
如果您需要更灵活的配置,可以选择自定义模型部署方式:
进入自定义部署页面
配置参数
启动部署
使用场景化方式部署的服务仅支持API接口调用。以下是调用示例(以机器翻译模型为例):
import requests
url = "https://<您的服务地址>/api/predict"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer <您的API密钥>"
}
data = {
"input": "Hello, world!",
"task": "translation"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())
对于大语言对话模型,调用方式类似,但需指定任务类型为chat:
import requests
url = "https://<您的服务地址>/api/predict"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer <您的API密钥>"
}
data = {
"input": "你是谁?",
"task": "chat"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())
ACCESS_TOKEN,否则可能导致服务无法正常加载。通过以上步骤,您可以将ModelScope中的模型成功部署为支持API调用的服务形式。如果有进一步问题,可以参考相关文档或联系技术支持团队。