通用文本向量模型全新升级至V3,开通百炼速来体验~~

简介: 阿里云新推出通用文本向量模型text-embedding-v3,基于LLM,支持50+语言,包括新增的意大利语等。模型升级亮点:8K长文本支持、可变向量维度、Sparse向量及不分Query/Document类型。现在提供50万免费tokens,有效期180天,计费0.0007元/1000 tokens。体验请访问[阿里云百炼官网](https://bailian.console.aliyun.com/?spm=a2c6h.13046898.publish-article.6.63066ffaL32qHM)

概述:

通用文本向量,是通义实验室基于LLM底座的多语言文本统一向量模型,面向全球多个主流语种,提供高水准的向量服务,帮助开发者将文本数据快速转换为高质量的向量数据


通用文本向量text-embedding-v3模型已于7月12号在阿里云百炼平台上线,免费赠送50万tokens,抓紧前来体验吧~~

体验入口:模型广场

image.png


text-embedding-v3

通用文本向量text-embedding-v3模型是text-embedding-v2模型的升级版本

主打特性:

  • 高性能、低成本
  • 50+多语言
  • 8K长文本


功能更新要点如下:


  • 语种扩充:text-embedding-v3模型对比text-embedding-v2模型扩展了意大利语、波兰语、越南语、泰语、菲律宾语等语种,支持语种数量增加到50+
  • 输入长度扩展:支持编码的输入长度从2048扩展至8192, 对text-embedding-v3, 8192指文本输入的最大token长度
  • Sparse向量支持:text-embedding-v3模型同时支持连续向量表示(dense vector)和离散向量表示模型(sparse vector), 用户可以在接口参数中指定输出连续向量、离散向量或者同时输出
  • 可变输出连续向量维度:相比text-embedding-v2模型的固定1536向量维度, text-embedding-v3支持用户自定义连续向量的维度, 目前可以选择512,768和1024维度;同时为了进一步节省下游任务的使用成本,text-embedding-v3模型在不衰减效果的前提下将最大的向量维度降低至1024维
  • 不再区分Query/Document类型:text-embedding-v3模型在不降低模型效果的前提下不再区分输入文本的类型,text_type参数无需指定输入的文本是Query还是Document类型
  • 效果提升:通过预训练模型底座和SFT策略优化提升embedding模型整体效果,中英文公开检索数据集评测检索效果对比text-embedding-v2提升15%


计费相关:


text-embedding-v3模型整体计费情况可点击计量计费查看

  • 通用文本向量模型计费是按照token来计算

这里token数量指的是大模型使用的tokenizer分词后对应的最小分词单元的数量。在通用文本向量模型中,单个token平均约对应1.5个汉字,0.7个英文单词。通用文本向量服务根据模型输出结果对应的token数量进行计量计费。每一次模型调用产生的实际token数量可以从response中获取

  • 计费单价:0.0007元/1000 tokens
  • 免费额度:50万tokens
  • 有效期:180天
  • 领取方式:开通阿里云百炼大模型后自动发放到账户中,点击产品开通了解详情(此领取方式仅限新人用户)

注意:阿里云大模型服务平台百炼和阿里云模型服务灵积为新用户提供了一系列的新人免费额度优惠。获取这些免费额度需要您满足以下条件中的一项:

开通阿里云大模型服务平台百炼:首次开通阿里云大模型服务平台百炼,且从未开通过阿里云模型服务灵积

开通阿里云模型服务灵积:首次开通阿里云模型服务灵积,且从未开通过阿里云大模型服务平台百炼

新人免费额度说明:

新人免费额度遵循以下活动规则:

  • 有效期计算规则:当您首次开通大模型服务平台百炼模型服务灵积时,平台将自动为您发放大模型服务平台百炼和模型服务灵积相关的所有新人免费额度,并开始计算免费额度的有效期。超过有效期后,您的新人免费额度将失效,继续使用模型服务将产生计费
  • 新增优惠规则:您获取的免费额度的种类、数量和有效期以开通时获取的优惠为准。您无法享受后续可能新增的各项新人优惠项目(特别注明的除外)
  • 优惠共享规则:大模型服务平台百炼和模型服务灵积共享新人免费额度,由此获取的免费额度的种类、数量和有效期,以先开通的平台获取的优惠为准


由于此模型是最新上线,目前对于所有初次申请体验的用户会免费发放50万tokens额度,抓紧去体验吧~~


欢迎大家在评论区交流探讨调用text-embedding-v3模型的体验与经验 。如果您在体验过程中有遇到什么问题需要我们解答,可以在评论区中留言探讨或是加入我们的官方支持群(群号:77600022533)进行交流反馈!


阿里云百炼官网网址

阿里云百炼控制台入口


相关实践学习
如何快速创建插件agent
阿里云百炼应用基于Assistant API技术架构,结合大语言模型(LLM)的推理、知识检索增强、插件调度等能力,构建应对各类复杂场景任务的场景应用。通过集成化、直观易用的产品界面,为开发者提供了丰富的应用配置选项,包括大型语言模型(LLM)选择、Pro
相关文章
|
3月前
|
存储 人工智能 自然语言处理
方案介绍|基于百炼生成向量数据并使用阿里云Milvus存储和检索
阿⾥云Milvus是⼀款云上全托管服务,提供⼤规模向量数据的相似性检索服务。100%兼容开源Milvus,在开源版本的基础上增强了可扩展性,具备易⽤性、可⽤性、安全性、低成本与⽣态优势。阿⾥云Milvus可以⽀持⼏乎所有涉及到向量搜索的场景。例如检索增强⽣成RAG,以及经典的搜索推荐、多模态检索等。阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。
|
5月前
|
编解码 人工智能 API
通义万相2.1视频/图像模型新升级!可在阿里云百炼直接体验
通义万相2.1模型推出新特征,包括复杂人物运动的稳定展现、现实物理规律的逼真还原及中英文视频特效的绚丽呈现。通过自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,并首次实现中文文字视频生成功能。升级后的通义万相荣登VBench榜单第一,提供电影级分镜效果、四格漫画故事速览及情侣头像创意定制等多种玩法,满足多样化的视觉创作需求。可直接在阿里云百炼平台调用API体验这些功能。
|
4月前
|
人工智能 运维 前端开发
基于阿里百炼的DeepSeek-R1满血版模型调用【零门槛保姆级2084小游戏开发实战】
本文介绍基于阿里百炼的DeepSeek-R1满血版模型调用,提供零门槛保姆级2048小游戏开发实战。文章分为三部分:定位与核心优势、实战部署操作指南、辅助实战开发。通过详细步骤和案例展示,帮助开发者高效利用DeepSeek-R1的强大推理能力,优化游戏逻辑与视觉效果,解决官网响应延迟问题,提升开发效率和用户体验。适合企业开发者、教育行业及多模态探索者使用。
90176 26
基于阿里百炼的DeepSeek-R1满血版模型调用【零门槛保姆级2084小游戏开发实战】
|
2月前
|
运维 数据挖掘 API
阿里云百炼控制台全新升级
阿里云百炼控制台全新升级,更开放、高效、易用!主要变化包括:模型、应用等功能模块拆分,贴合使用场景;模型按“家族”聚类,搜索便捷;子业务空间授权入口调整,支持批量操作;应用相关功能集成在“应用”页面;新增MCP管理和广场,实现一键部署免运维,大幅降低开发门槛。
阿里云百炼控制台全新升级
|
3月前
|
机器学习/深度学习 人工智能 测试技术
阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版
通义千问团队推出了320亿参数的QwQ-32B模型,通过大规模强化学习和多阶段训练,在数学、编程及通用能力上达到或超越了DeepSeek-R1等先进模型。QwQ-32B模型已在阿里云百炼上线,支持API调用,用户可通过官方文档了解详细使用方法。未来,团队将继续探索智能体与RL集成,推动人工通用智能的发展。
|
4月前
|
自然语言处理 开发者
DeepSeek全尺寸模型上线阿里云百炼!
DeepSeek全尺寸模型上线阿里云百炼!
136 4
|
4月前
|
人工智能 Java 语音技术
零基础上手百炼语音AI模型|Github示例工程介绍
零基础上手百炼语音AI模型|Github示例工程介绍
|
4月前
|
人工智能 自然语言处理 API
DeepSeek全尺寸模型上线阿里云百炼!
阿里云百炼平台近日上线了DeepSeek-V3、DeepSeek-R1及其蒸馏版本等六款全尺寸AI模型,参数量达671B,提供高达100万免费tokens。这些模型在数学、代码、自然语言推理等任务上表现出色,支持灵活调用和经济高效的解决方案,助力开发者和企业加速创新与数字化转型。示例代码展示了如何通过API使用DeepSeek-R1模型进行推理,用户可轻松获取思考过程和最终答案。
|
4月前
|
人工智能 Java 语音技术
【最佳实践系列】零基础上手阿里云百炼语音AI模型
阿里云百炼语音AI服务提供了丰富的功能,包括语音识别、语音合成、实时翻译等。通过`alibabacloud-bailian-speech-demo`项目,可以一键调用这些服务,体验语音及大模型的魅力,降低接入门槛。该项目支持Python和Java,涵盖从简单的一句话合成到复杂的同声传译等多个示例,助力开发者快速上手并进行二次开发。

相关产品

  • 大模型服务平台百炼