机器学习PAI关于Chinese-CLIP模型，有人可以解答这个提问吗？

机器学习PAI关于Chinese-CLIP模型，有人可以解答这个提问吗？https://modelscope.cn/models/iic/multi-modal_clip-vit-large-patch14_336_zh/feedback/issueDetail/10226

展开

收起

真的很搞笑 2024-05-13 13:05:45 406 版权

阿里云 AI 助理回答

关于您提到的 Chinese-CLIP 模型 的问题，以下是基于知识库资料提供的详细解答：

1. Chinese-CLIP 模型概述

Chinese-CLIP 是一个多模态模型，主要用于处理图像和文本之间的跨模态检索任务。根据知识库中的信息，PAI 提供了预训练的 Chinese-CLIP 模型，其具体配置如下： - 模型类型: imagetext_retrieval_cn（中文 CLIP） - Processor 种类: EasyNLP - Predictor: easynlp.appzoo.CLIPPredictor - 模型路径: 预训练模型存储在阿里云 OSS 中，路径为：release/easynlp_modelzoo/alibaba-pai/clip_chinese_roberta_base_vit_base.tgz

如果您需要使用该模型，可以直接通过 PAI 平台加载预训练模型，或者参考 DSW Gallery 示例自行构建模型。

2. 模型部署方式

方式一：场景化模型部署

您可以直接通过 PAI 平台进行场景化部署，步骤如下： 1. 进入 ModelScope 模型部署 页面。 2. 配置关键参数，例如模型路径、Processor 类型等。 3. 单击部署按钮完成服务部署。

方式二：自定义模型部署

如果需要更灵活的部署方式，可以采用自定义模型部署流程： 1. 获取模型信息: - MODEL_ID: 模型 ID，例如 iic/multi-modal_clip-vit-large-patch14_336_zh。 - TASK: 模型的任务类型，例如 multi-modal。 - REVISION: 模型版本号，例如 v1.0.0 或 v1.0.1。 - ACCESS_TOKEN（可选）: 如果模型是非公开的，需要提供 SDK 访问令牌。 2. 保存模型信息到本地: 将上述信息保存到本地文件中，以便后续部署时使用。 3. 调用 API 接口: 部署完成后，可以通过 API 接口调用模型服务。例如，以下代码展示了如何将图片转换为 Base64 编码并发送请求：

import requests
import json
import base64

service_url = 'YOUR_SERVICE_URL'
token = 'YOUR_SERVICE_TOKEN'

with open('image.jpg', 'rb') as img_file:
    img = img_file.read()
    img_base64encoded = base64.b64encode(img)

request = {"input": {"image": img_base64encoded.decode()}}
request_data = json.dumps(request)

resp = requests.post(service_url, headers={"Authorization": token}, data=request_data)
print(resp.text)  # 输出模型结果

3. 常见问题及解决方案

问题 1: 模型加载失败

如果在部署过程中遇到模型加载失败的问题，可能是由于模型文件类型不匹配导致的。PAI EAS 预置的 PyTorch Processor 基于 C++ LibTorch 开发，仅支持加载 TorchScript 格式的模型。
解决方案: - 确保模型已保存为 TorchScript 格式。可以参考 PyTorch 官方教程将模型转换为 TorchScript 格式。

问题 2: 公网访问权限

如果输入图片的 URL 地址无法被识别，可能是因为服务未开通公网访问权限。
解决方案: - 在服务部署时，确保配置了公网访问权限，并正确设置白名单。

4. 模型调用示例

以下是一个调用 Chinese-CLIP 模型的完整示例： 1. 准备输入数据: - 图像数据可以是 Base64 编码或图片 URL。 - 文本数据为待检索的中文句子。 2. 发送请求: 使用 HTTP POST 请求将数据发送到模型服务接口。 3. 解析结果: 模型返回的结果通常包括图像与文本的相似度分数。