通用文本向量模型全新升级至V3,开通百炼速来体验~~

简介: 阿里云新推出通用文本向量模型text-embedding-v3,基于LLM,支持50+语言,包括新增的意大利语等。模型升级亮点:8K长文本支持、可变向量维度、Sparse向量及不分Query/Document类型。现在提供50万免费tokens,有效期180天,计费0.0007元/1000 tokens。体验请访问[阿里云百炼官网](https://bailian.console.aliyun.com/?spm=a2c6h.13046898.publish-article.6.63066ffaL32qHM)

概述:

通用文本向量,是通义实验室基于LLM底座的多语言文本统一向量模型,面向全球多个主流语种,提供高水准的向量服务,帮助开发者将文本数据快速转换为高质量的向量数据


通用文本向量text-embedding-v3模型已于7月12号在阿里云百炼平台上线,免费赠送50万tokens,抓紧前来体验吧~~

体验入口:模型广场

image.png


text-embedding-v3

通用文本向量text-embedding-v3模型是text-embedding-v2模型的升级版本

主打特性:

  • 高性能、低成本
  • 50+多语言
  • 8K长文本


功能更新要点如下:


  • 语种扩充:text-embedding-v3模型对比text-embedding-v2模型扩展了意大利语、波兰语、越南语、泰语、菲律宾语等语种,支持语种数量增加到50+
  • 输入长度扩展:支持编码的输入长度从2048扩展至8192, 对text-embedding-v3, 8192指文本输入的最大token长度
  • Sparse向量支持:text-embedding-v3模型同时支持连续向量表示(dense vector)和离散向量表示模型(sparse vector), 用户可以在接口参数中指定输出连续向量、离散向量或者同时输出
  • 可变输出连续向量维度:相比text-embedding-v2模型的固定1536向量维度, text-embedding-v3支持用户自定义连续向量的维度, 目前可以选择512,768和1024维度;同时为了进一步节省下游任务的使用成本,text-embedding-v3模型在不衰减效果的前提下将最大的向量维度降低至1024维
  • 不再区分Query/Document类型:text-embedding-v3模型在不降低模型效果的前提下不再区分输入文本的类型,text_type参数无需指定输入的文本是Query还是Document类型
  • 效果提升:通过预训练模型底座和SFT策略优化提升embedding模型整体效果,中英文公开检索数据集评测检索效果对比text-embedding-v2提升15%


计费相关:


text-embedding-v3模型整体计费情况可点击计量计费查看

  • 通用文本向量模型计费是按照token来计算

这里token数量指的是大模型使用的tokenizer分词后对应的最小分词单元的数量。在通用文本向量模型中,单个token平均约对应1.5个汉字,0.7个英文单词。通用文本向量服务根据模型输出结果对应的token数量进行计量计费。每一次模型调用产生的实际token数量可以从response中获取

  • 计费单价:0.0007元/1000 tokens
  • 免费额度:50万tokens
  • 有效期:180天
  • 领取方式:开通阿里云百炼大模型后自动发放到账户中,点击产品开通了解详情(此领取方式仅限新人用户)

注意:阿里云大模型服务平台百炼和阿里云模型服务灵积为新用户提供了一系列的新人免费额度优惠。获取这些免费额度需要您满足以下条件中的一项:

开通阿里云大模型服务平台百炼:首次开通阿里云大模型服务平台百炼,且从未开通过阿里云模型服务灵积

开通阿里云模型服务灵积:首次开通阿里云模型服务灵积,且从未开通过阿里云大模型服务平台百炼

新人免费额度说明:

新人免费额度遵循以下活动规则:

  • 有效期计算规则:当您首次开通大模型服务平台百炼模型服务灵积时,平台将自动为您发放大模型服务平台百炼和模型服务灵积相关的所有新人免费额度,并开始计算免费额度的有效期。超过有效期后,您的新人免费额度将失效,继续使用模型服务将产生计费
  • 新增优惠规则:您获取的免费额度的种类、数量和有效期以开通时获取的优惠为准。您无法享受后续可能新增的各项新人优惠项目(特别注明的除外)
  • 优惠共享规则:大模型服务平台百炼和模型服务灵积共享新人免费额度,由此获取的免费额度的种类、数量和有效期,以先开通的平台获取的优惠为准


由于此模型是最新上线,目前对于所有初次申请体验的用户会免费发放50万tokens额度,抓紧去体验吧~~


欢迎大家在评论区交流探讨调用text-embedding-v3模型的体验与经验 。如果您在体验过程中有遇到什么问题需要我们解答,可以在评论区中留言探讨或是加入我们的官方支持群(群号:77600022533)进行交流反馈!


阿里云百炼官网网址

阿里云百炼控制台入口


相关文章
|
6月前
|
自然语言处理
阿里云百炼大模型服务--企业知识检索问答指南
阿里云百炼提供的企业知识检索问答应用可以帮助大家实现让大模型瞬间“开挂”的技能。结合上传的知识数据,大模型识别解析学习文档内容,最终给出生成式回复。我们在通义千问-Turbo/Max大模型基础上,将文件上传、读取、切片、向量化等过程都开发好预置在应用中,实现开箱即用,更能满足您的日常需求。
|
6月前
|
机器学习/深度学习 安全 Java
视觉智能平台常见问题之图像生产功能开通时一直开通不成功如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
|
6月前
|
机器学习/深度学习 Java PHP
视觉智能平台常见问题之无法购买服务如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
|
3月前
|
人工智能 自然语言处理 API
阿里云百炼上线FLUX文生图模型中文优化版,可免费调用!
阿里云百炼上线FLUX文生图模型中文优化版,可免费调用!
411 6
|
3月前
|
人工智能 自然语言处理 API
阿里云百炼平台上线首个最新文生图模型FLUX中文优化版
由Stable Diffusion团队推出的开源文生图模型FLUX风靡全球,其生成质量媲美Midjourney,被誉为“开源王者”。阿里云百炼平台首发FLUX中文优化版,提升了中文指令的理解与执行能力。开发者可直接在平台上体验并调用FLUX模型,且享有1000张图像的免费生成额度,有效期180天。无需额外部署,即可轻松利用这一先进模型创造高质量图像。
|
4月前
|
自然语言处理 数据管理 数据挖掘
阿里云百炼知识检索应用评测:构建智能问答助手【开发者评测|阿里云百炼】
阿里云百炼是基于大模型的一站式开发平台,支持快速构建智能问答助手。评测中,通过上传企业数据创建知识库,并配置应用参数如温度系数、最长回复长度等,最终通过API实现问答功能。实操难点包括数据上传限制及参数配置复杂度。建议增加上传灵活性、提供更多配置指南和功能扩展插件。总体而言,阿里云百炼提供了强大且灵活的工具,有助于高效开发大模型应用。
2283 5
|
6月前
|
机器学习/深度学习 安全 Java
视觉智能平台常见问题之“图像生产”功能开通时一直开通不成功如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
|
4月前
|
自然语言处理 监控 搜索推荐
阿里云百炼知识检索应用评测:搭建个人/企业专属智能问答助手
阿里云百炼知识检索应用评测:搭建个人/企业专属智能问答助手
246 3
|
4月前
|
存储 弹性计算 安全
体验通义万相文本测评
体验通义万相文本测评
|
4月前
|
弹性计算 API 对象存储
在体验通义万相文本绘图测评
在体验通义万相文本绘图