通用文本向量模型全新升级至V3,开通百炼速来体验~~

简介: 阿里云新推出通用文本向量模型text-embedding-v3,基于LLM,支持50+语言,包括新增的意大利语等。模型升级亮点:8K长文本支持、可变向量维度、Sparse向量及不分Query/Document类型。现在提供50万免费tokens,有效期180天,计费0.0007元/1000 tokens。体验请访问[阿里云百炼官网](https://bailian.console.aliyun.com/?spm=a2c6h.13046898.publish-article.6.63066ffaL32qHM)

概述:

通用文本向量,是通义实验室基于LLM底座的多语言文本统一向量模型,面向全球多个主流语种,提供高水准的向量服务,帮助开发者将文本数据快速转换为高质量的向量数据


通用文本向量text-embedding-v3模型已于7月12号在阿里云百炼平台上线,免费赠送50万tokens,抓紧前来体验吧~~

体验入口:模型广场

image.png


text-embedding-v3

通用文本向量text-embedding-v3模型是text-embedding-v2模型的升级版本

主打特性:

  • 高性能、低成本
  • 50+多语言
  • 8K长文本


功能更新要点如下:


  • 语种扩充:text-embedding-v3模型对比text-embedding-v2模型扩展了意大利语、波兰语、越南语、泰语、菲律宾语等语种,支持语种数量增加到50+
  • 输入长度扩展:支持编码的输入长度从2048扩展至8192, 对text-embedding-v3, 8192指文本输入的最大token长度
  • Sparse向量支持:text-embedding-v3模型同时支持连续向量表示(dense vector)和离散向量表示模型(sparse vector), 用户可以在接口参数中指定输出连续向量、离散向量或者同时输出
  • 可变输出连续向量维度:相比text-embedding-v2模型的固定1536向量维度, text-embedding-v3支持用户自定义连续向量的维度, 目前可以选择512,768和1024维度;同时为了进一步节省下游任务的使用成本,text-embedding-v3模型在不衰减效果的前提下将最大的向量维度降低至1024维
  • 不再区分Query/Document类型:text-embedding-v3模型在不降低模型效果的前提下不再区分输入文本的类型,text_type参数无需指定输入的文本是Query还是Document类型
  • 效果提升:通过预训练模型底座和SFT策略优化提升embedding模型整体效果,中英文公开检索数据集评测检索效果对比text-embedding-v2提升15%


计费相关:


text-embedding-v3模型整体计费情况可点击计量计费查看

  • 通用文本向量模型计费是按照token来计算

这里token数量指的是大模型使用的tokenizer分词后对应的最小分词单元的数量。在通用文本向量模型中,单个token平均约对应1.5个汉字,0.7个英文单词。通用文本向量服务根据模型输出结果对应的token数量进行计量计费。每一次模型调用产生的实际token数量可以从response中获取

  • 计费单价:0.0007元/1000 tokens
  • 免费额度:50万tokens
  • 有效期:180天
  • 领取方式:开通阿里云百炼大模型后自动发放到账户中,点击产品开通了解详情(此领取方式仅限新人用户)

注意:阿里云大模型服务平台百炼和阿里云模型服务灵积为新用户提供了一系列的新人免费额度优惠。获取这些免费额度需要您满足以下条件中的一项:

开通阿里云大模型服务平台百炼:首次开通阿里云大模型服务平台百炼,且从未开通过阿里云模型服务灵积

开通阿里云模型服务灵积:首次开通阿里云模型服务灵积,且从未开通过阿里云大模型服务平台百炼

新人免费额度说明:

新人免费额度遵循以下活动规则:

  • 有效期计算规则:当您首次开通大模型服务平台百炼模型服务灵积时,平台将自动为您发放大模型服务平台百炼和模型服务灵积相关的所有新人免费额度,并开始计算免费额度的有效期。超过有效期后,您的新人免费额度将失效,继续使用模型服务将产生计费
  • 新增优惠规则:您获取的免费额度的种类、数量和有效期以开通时获取的优惠为准。您无法享受后续可能新增的各项新人优惠项目(特别注明的除外)
  • 优惠共享规则:大模型服务平台百炼和模型服务灵积共享新人免费额度,由此获取的免费额度的种类、数量和有效期,以先开通的平台获取的优惠为准


由于此模型是最新上线,目前对于所有初次申请体验的用户会免费发放50万tokens额度,抓紧去体验吧~~


欢迎大家在评论区交流探讨调用text-embedding-v3模型的体验与经验 。如果您在体验过程中有遇到什么问题需要我们解答,也可以在评论区中留言探讨!




相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
相关文章
|
3月前
|
机器学习/深度学习 人工智能 安全
千帆大模型平台再升级:接入大模型最多、Prompt模板最全面
千帆大模型平台再升级:接入大模型最多、Prompt模板最全面
184 1
|
3月前
|
人工智能 安全 数据管理
百度智能云“千帆大模型平台”升级:大模型最多,Prompt模板最全(下)
百度智能云“千帆大模型平台”升级:大模型最多,Prompt模板最全
146 0
|
3月前
|
机器学习/深度学习 Java PHP
视觉智能平台常见问题之无法购买服务如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
|
3月前
|
人工智能 自然语言处理 安全
百度智能云“千帆大模型平台”升级:大模型最多,Prompt模板最全(上)
百度智能云“千帆大模型平台”升级:大模型最多,Prompt模板最全
181 1
|
11天前
|
人工智能 自然语言处理 API
阿里云百炼平台上线首个最新文生图模型FLUX中文优化版
由Stable Diffusion团队推出的开源文生图模型FLUX风靡全球,其生成质量媲美Midjourney,被誉为“开源王者”。阿里云百炼平台首发FLUX中文优化版,提升了中文指令的理解与执行能力。开发者可直接在平台上体验并调用FLUX模型,且享有1000张图像的免费生成额度,有效期180天。无需额外部署,即可轻松利用这一先进模型创造高质量图像。
|
19天前
|
自然语言处理 数据管理 数据挖掘
阿里云百炼知识检索应用评测:构建智能问答助手【开发者评测|阿里云百炼】
阿里云百炼是基于大模型的一站式开发平台,支持快速构建智能问答助手。评测中,通过上传企业数据创建知识库,并配置应用参数如温度系数、最长回复长度等,最终通过API实现问答功能。实操难点包括数据上传限制及参数配置复杂度。建议增加上传灵活性、提供更多配置指南和功能扩展插件。总体而言,阿里云百炼提供了强大且灵活的工具,有助于高效开发大模型应用。
2103 5
|
20天前
|
人工智能 前端开发 搜索推荐
详解基于百炼平台及函数计算快速上线网页AI助手
通过阿里云百炼平台,企业可在10分钟内为其网站添加智能客服系统,提升用户体验并降低成本。流程包括:创建大模型应用、配置参数(如温度系数以控制回复的随机性)、发布应用获取API密钥;使用函数计算快速搭建示例网站,并通过简单的代码更改启用AI助手功能;还可导入私有知识库增强助手的能力。前端基于NLUX开发,支持定制化需求如样式调整和历史会话管理。服务端代码提供了调用大模型获取答案的接口。借助百炼平台,企业能迅速部署即时且个性化的在线服务,适应数字化转型的需求。
|
4天前
|
人工智能 自然语言处理 API
阿里云百炼上线FLUX文生图模型中文优化版,可免费调用!
阿里云百炼上线FLUX文生图模型中文优化版,可免费调用!
29 0
|
1月前
|
自然语言处理 监控 搜索推荐
阿里云百炼知识检索应用评测:搭建个人/企业专属智能问答助手
阿里云百炼知识检索应用评测:搭建个人/企业专属智能问答助手
152 3
|
2月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之通用视频生成能力生成的视频时长最长是多少
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。