怎样使用程序从本地计算机调用modelscope公网的bge-m3模型做文档向量化?是否可以提供一点参考代码?本地的python版本是python3.10
可以的,ModelScope 官方是支持通过 API 调用 bge-m3 模型做文本向量化 的,不需要在本地下载模型权重,适合在本地程序中直接使用。
下面给一个 Python 3.10 下的简单示例,演示如何调用 ModelScope 公网的 bge-m3 embedding 接口。
2.设置 API Key
需要先在阿里云控制台获取 DashScope API Key,然后在环境变量中设置:
export DASHSCOPE_API_KEY=你的_API_KEY
(Windows 可用 setx DASHSCOPE_API_KEY xxx)
3.示例代码:文本向量化(bge-m3)
from dashscope import TextEmbedding
texts = [
"这是第一段测试文本",
"这是第二段文本,用于向量化"
]
resp = TextEmbedding.call(
model="bge-m3",
input=texts
)
if resp.status_code == 200:
embeddings = [item["embedding"] for item in resp.output["embeddings"]]
print(len(embeddings), len(embeddings[0]))
else:
print(resp)
说明
4.bge-m3 是多语言通用 embedding 模型,适合中英文文档向量化
返回的 embedding 是一个浮点数组,可直接用于:
向量数据库(FAISS / Milvus / Elastic)
文档相似度检索
RAG 场景
5.注意事项
公网调用受 QPS 和配额限制,批量文档建议分批请求
如果对延迟或隐私有要求,可以考虑后续私有化部署(PAI / EAS)
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352