通用文本向量模型全新升级至V3,开通百炼速来体验~~

本文涉及的产品
多模态交互后付费免费试用,全链路、全Agent
简介: 阿里云新推出通用文本向量模型text-embedding-v3,基于LLM,支持50+语言,包括新增的意大利语等。模型升级亮点:8K长文本支持、可变向量维度、Sparse向量及不分Query/Document类型。现在提供50万免费tokens,有效期180天,计费0.0007元/1000 tokens。体验请访问[阿里云百炼官网](https://bailian.console.aliyun.com/?spm=a2c6h.13046898.publish-article.6.63066ffaL32qHM)

概述:

通用文本向量,是通义实验室基于LLM底座的多语言文本统一向量模型,面向全球多个主流语种,提供高水准的向量服务,帮助开发者将文本数据快速转换为高质量的向量数据


通用文本向量text-embedding-v3模型已于7月12号在阿里云百炼平台上线,免费赠送50万tokens,抓紧前来体验吧~~

体验入口:模型广场

image.png


text-embedding-v3

通用文本向量text-embedding-v3模型是text-embedding-v2模型的升级版本

主打特性:

  • 高性能、低成本
  • 50+多语言
  • 8K长文本


功能更新要点如下:


  • 语种扩充:text-embedding-v3模型对比text-embedding-v2模型扩展了意大利语、波兰语、越南语、泰语、菲律宾语等语种,支持语种数量增加到50+
  • 输入长度扩展:支持编码的输入长度从2048扩展至8192, 对text-embedding-v3, 8192指文本输入的最大token长度
  • Sparse向量支持:text-embedding-v3模型同时支持连续向量表示(dense vector)和离散向量表示模型(sparse vector), 用户可以在接口参数中指定输出连续向量、离散向量或者同时输出
  • 可变输出连续向量维度:相比text-embedding-v2模型的固定1536向量维度, text-embedding-v3支持用户自定义连续向量的维度, 目前可以选择512,768和1024维度;同时为了进一步节省下游任务的使用成本,text-embedding-v3模型在不衰减效果的前提下将最大的向量维度降低至1024维
  • 不再区分Query/Document类型:text-embedding-v3模型在不降低模型效果的前提下不再区分输入文本的类型,text_type参数无需指定输入的文本是Query还是Document类型
  • 效果提升:通过预训练模型底座和SFT策略优化提升embedding模型整体效果,中英文公开检索数据集评测检索效果对比text-embedding-v2提升15%


计费相关:


text-embedding-v3模型整体计费情况可点击计量计费查看

  • 通用文本向量模型计费是按照token来计算

这里token数量指的是大模型使用的tokenizer分词后对应的最小分词单元的数量。在通用文本向量模型中,单个token平均约对应1.5个汉字,0.7个英文单词。通用文本向量服务根据模型输出结果对应的token数量进行计量计费。每一次模型调用产生的实际token数量可以从response中获取

  • 计费单价:0.0007元/1000 tokens
  • 免费额度:50万tokens
  • 有效期:180天
  • 领取方式:开通阿里云百炼大模型后自动发放到账户中,点击产品开通了解详情(此领取方式仅限新人用户)

注意:阿里云大模型服务平台百炼和阿里云模型服务灵积为新用户提供了一系列的新人免费额度优惠。获取这些免费额度需要您满足以下条件中的一项:

开通阿里云大模型服务平台百炼:首次开通阿里云大模型服务平台百炼,且从未开通过阿里云模型服务灵积

开通阿里云模型服务灵积:首次开通阿里云模型服务灵积,且从未开通过阿里云大模型服务平台百炼

新人免费额度说明:

新人免费额度遵循以下活动规则:

  • 有效期计算规则:当您首次开通大模型服务平台百炼模型服务灵积时,平台将自动为您发放大模型服务平台百炼和模型服务灵积相关的所有新人免费额度,并开始计算免费额度的有效期。超过有效期后,您的新人免费额度将失效,继续使用模型服务将产生计费
  • 新增优惠规则:您获取的免费额度的种类、数量和有效期以开通时获取的优惠为准。您无法享受后续可能新增的各项新人优惠项目(特别注明的除外)
  • 优惠共享规则:大模型服务平台百炼和模型服务灵积共享新人免费额度,由此获取的免费额度的种类、数量和有效期,以先开通的平台获取的优惠为准


由于此模型是最新上线,目前对于所有初次申请体验的用户会免费发放50万tokens额度,抓紧去体验吧~~


欢迎大家在评论区交流探讨调用text-embedding-v3模型的体验与经验 。如果您在体验过程中有遇到什么问题需要我们解答,可以在评论区中留言探讨或是加入我们的官方支持群(群号:120480015429)进行交流反馈!


阿里云百炼官网网址

阿里云百炼控制台入口


相关文章
人工智能
131 0
|
Java 数据处理
阿里云百炼工作流支持多模型协同标注,三模型投票分类用户意图实战
本文介绍了一种基于多模型协作的高效分类工作流方案,用于解决传统标注工作中人力依赖大、易出错的问题。通过通义千问系列的 Qwen-Plus、Qwen-Max 和 Qwen3-30b-a3b 三大模型,结合投票机制,实现售前售后意图识别的精准分类。文中详细讲解了如何在阿里云百炼应用广场创建任务型工作流,包括模型节点配置、条件判断设置及测试发布全流程。此外,还提供了批量打标的 Java 示例代码,适用于更复杂的意图标注场景。跟随文章步骤,即可快速构建高效率、高准确性的分类系统。
839 0
|
3月前
|
JSON 数据格式
本地部署的qwen3-8b模型和百炼上的qwen3-8b模型效果不一致
我在使用Function Call时发现,百炼平台上的Qwen3-8B模型与本地部署的Qwen3-8B模型效果存在差异,主要体现在函数参数生成上,本地模型常出现漏参或JSON格式错误,而百炼模型表现正常。想确认百炼平台的Qwen3-8B是否为更高版本?
|
5月前
|
运维 数据挖掘 API
阿里云百炼控制台全新升级
阿里云百炼控制台全新升级,更开放、高效、易用!主要变化包括:模型、应用等功能模块拆分,贴合使用场景;模型按“家族”聚类,搜索便捷;子业务空间授权入口调整,支持批量操作;应用相关功能集成在“应用”页面;新增MCP管理和广场,实现一键部署免运维,大幅降低开发门槛。
616 14
阿里云百炼控制台全新升级
|
6月前
|
存储 人工智能 自然语言处理
方案介绍|基于百炼生成向量数据并使用阿里云Milvus存储和检索
阿⾥云Milvus是⼀款云上全托管服务,提供⼤规模向量数据的相似性检索服务。100%兼容开源Milvus,在开源版本的基础上增强了可扩展性,具备易⽤性、可⽤性、安全性、低成本与⽣态优势。阿⾥云Milvus可以⽀持⼏乎所有涉及到向量搜索的场景。例如检索增强⽣成RAG,以及经典的搜索推荐、多模态检索等。阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。
|
机器学习/深度学习 人工智能 测试技术
阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版
通义千问团队推出了320亿参数的QwQ-32B模型,通过大规模强化学习和多阶段训练,在数学、编程及通用能力上达到或超越了DeepSeek-R1等先进模型。QwQ-32B模型已在阿里云百炼上线,支持API调用,用户可通过官方文档了解详细使用方法。未来,团队将继续探索智能体与RL集成,推动人工通用智能的发展。
8741 0
|
7月前
|
人工智能 Java 语音技术
零基础上手百炼语音AI模型|Github示例工程介绍
零基础上手百炼语音AI模型|Github示例工程介绍
|
7月前
|
自然语言处理 开发者
DeepSeek全尺寸模型上线阿里云百炼!
DeepSeek全尺寸模型上线阿里云百炼!
252 4

相关产品

  • 大模型服务平台百炼