阿里云百炼的模型怎么选择并体验

简介: 本模块为您提供大模型服务平台百炼中支持的模型类型,便于您快速根据自己的需求选择所需模型!

什么是大模型服务平台百炼

大模型服务平台百炼是一站式的企业专属大模型生产平台,基于通义基础大模型,提供企业专属大模型开发和应用的整套工具链。

  • 面向对象:企业、开发者及ISV的技术人员。
  • 核心能力:支持开箱即用的应用调用,大模型训练微调和一站式在线灵活部署。
  • 服务形式:通过API服务输出给客户,方便客户进行集成和使用专属大模型能力。
  • 应用编排:支持客户打通自己的业务能力API,使得客户可以将专属大模型能力结合进入自己的业务链路。

大模型服务平台百炼都提供哪些模型

大模型服务平台百炼不仅提供通义系列开源、闭源模型,还提供了第三方专属大模型,下面我们一起看看有哪些模型吧!

通义千问系列

说明:模型限流和免费额度请点击链接查看完整信息。

模型名称

模型介绍

应用场景

qwen-turbo 通义千问超大规模语言模型,支持中文、英文等不同语言输入。
  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

  • 翻译服务:提供各类语言的翻译服务,如英语、日语、法语或西班牙语等。

  • 对话模拟:扮演不同角色进行交互式对话。

  • 数据可视化:图表制作和数据呈现等。

qwen-plus 通义千问超大规模语言模型增强版,支持中文、英文等不同语言输入。
qwen-max 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。

qwen-max-1201

将于2024年4月22日下线

通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。
qwen-max-longcontext 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。
qwen-vl-plus 通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能。
  • 看图做题;

  • 图文识别;

  • 增强分辨率;

qwen-vl-max 通义千问超大规模视觉语言模型。相比增强版,再次提升视觉推理能力和指令遵循能力,提供更高的视觉感知和认知水平。在更多复杂任务上提供最佳的性能。


通义千问开源系列

说明:模型限流和免费额度请点击链接查看完整信息。

模型名称

模型介绍

应用场景

qwen-vl-v1

以 Qwen-7B 语言模型初始化,添加图像模型,图像输入分辨率为448的预训练模型。
  • 支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;

  • 支持多图输入和比较,指定图片问答,多图文学创作等;

  • 通过中文开放域语言表达进行检测框标注;

qwen-vl-chat-v1 通义千问VL支持灵活的交互方式,包括多图、多轮问答、创作等能力的模型。
qwen1.5-72b-chat 通义千问1.5对外开源的72B规模参数量的经过人类指令对齐的chat模型。
  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

qwen-72b-chat 通义千问对外开源的72B规模参数量的经过人类指令对齐的chat模型。
qwen-14b-chat 通义千问对外开源的14B规模参数量的经过人类指令对齐的chat模型。
qwen1.5-14b-chat 通义千问1.5对外开源的14B规模参数量的经过人类指令对齐的chat模型。
qwen1.5-7b-chat 通义千问1.5对外开源的7B规模参数量是经过人类指令对齐的chat模型。
qwen-7b-chat 通义千问对外开源的7B规模参数量的经过人类指令对齐的chat模型。
qwen-1.8b-longcontext-chat 通义千问对外开源的1.8B规模参数量的经过人类指令对齐的chat模型。
qwen-1.8b-chat 通义千问对外开源的1.8B规模参数量的经过人类指令对齐的chat模型。


通义万象系列

说明:模型限流和免费额度请点击链接查看完整信息。

模型名称

模型介绍

应用场景

wanx-v1 基于自研的Composer组合生成框架的AI绘画创作大模型,能够根据用户输入的文字内容,生成符合语义描述的不同风格的图像。通过知识重组与可变维度扩散模型,加速收敛并提升最终生成图片的效果, 结果自然、细节丰富。支持中英文双语输入。


  • 包括但不限于:水彩、油画、中国画、素描、扁平插画、二次元、3D卡通
wanx-style-repaint-v1 将输入的人物图像进行多种风格化的重绘生成,使新生成的图像在兼顾原始人物相貌的同时,带来不同风格的绘画效果。当前支持的风格有:复古漫画、3D童话、二次元、小清新、未来科技等。
  • 支持的风格有:复古漫画、3D童话、二次元、小清新、未来科技等。
wanx-background-generation-v2 可以基于输入的前景图像素材拓展生成背景信息,实现自然的光影融合效果,与细腻的写实画面生成。
  • 支持文本描述、图像引导等多种方式,同时支持对生成的图像智能添加文字内容。
  • 支持通用、家居和美妆分场景的多个预设模型。
  • 支持边缘引导元素生成,指定背景生成图片里有前景和背景特定内容元素引导生成。
wanx-sketch-to-image-lite 通义万相-涂鸦作画通过手绘任意内容加文字描述,即可生成精美的涂鸦绘画作品,作品中的内容在参考手绘线条的同时,兼顾创意性和趣味性。涂鸦作画支持扁平插画、油画、二次元、3D卡通和水彩5种风格,可用于创意娱乐、辅助设计、儿童教学等场景。
  • 通过手绘任意内容加文字描述,即可生成精美的涂鸦绘画作品,作品中的内容在参考手绘线条的同时,兼顾创意性和趣味性。

通用文本向量模型

说明:模型限流和免费额度请点击链接查看完整信息。

模型名称

模型介绍

应用场景

text-embedding-v1 支持多语种输出,包含中文、英语、西班牙语、法语、葡萄牙语、印尼语。
  • 多语言输出;

  • 自然语言翻译;

text-embedding-v2 支持多语种输出,包含中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语。

text-embedding-async-v1

支持多种语种输出,包含中文、英语、西班牙语、法语、葡萄牙语、印尼语。
text-embedding-async-v2 支持多种语种输出,包含中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语。

三方开源大模型

说明:模型限流和免费额度请点击链接查看完整信息。


Llama2大语言模型

模型名称

模型介绍

应用场景

llama2-7b-chat-v2

来自Meta开发并公开发布的大型语言模型(LLMs)。

该系列模型提供了多种参数大小(7B、13B和70B等)的版本,并同时提供了预训练和针对对话场景的微调版本。 Llama 2系列使用了2T token进行训练,相比于LLama多出40%,上下文长度从LLama的2048升级到4096,可以理解更长的文本, 在多个公开基准测试上超过了已有的开源模型。 采用了高质量的数据进行微调和基于人工反馈的强化学习训练,具有较高的可靠性和安全性。

阿里云百炼提供的llama2-7b-chat-v2和llama2-13b-chat-v2,分别为7B和13B规模的LLaMa2模型,针对对话场景微调优化后的版本。
llama2-13b-chat-v2

百川模型

模型名称

模型介绍

应用场景

baichuan2-7b-chat-v1

baichuan-13B/baichuan2-7B是由百川智能开发的一个开源的大规模预训练模型。基于Transformer结构,在大约1.2万亿tokens上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。

百川模型2-7B对话版/百川模型2-13B对话版,支持message和prompt格式输入。
baichuan2-13b-chat-v1
baichuan-7b-v1

仅支持prompt格式输入。

MOSS开源对话语言模型

模型名称

模型介绍

应用场景

moss-moon-003-sft MOSS-MOON-003-SFT模型是复旦大学出品的大规模语言模型,它在灵积平台上的模型名称为"moss-moon-003-sft-v1"。MOSS是一个支持中英双语和多种插件的开源对话语言模型,MOSS-MOON系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 支持中英双语和多种插件的开源对话语言模型。
moss-moon-003-base


ChatGLM开源双语对话语言模型


模型名称

模型介绍

应用场景

chatglm-6b-v2

ChatGLM2是开源中英双语对话模型ChatGLM-6B的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B引入了如下新特性:

  1. 更强大的性能:基于 ChatGLM 初代模型的开发经验,全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了GLM的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。
  2. 更长的上下文:基于FlashAttention技术,将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,会在后续迭代升级中着重进行优化。
  3. 更高效的推理:基于Multi-Query Attention技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。
该模型为ChatGLM2系列,仅支持prompt格式输入。
chatglm3-6b

ChatGLM3是ChatGLM 系列最新一代的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B 引入了如下特性:

  1. 更强大的基础模型:ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示,ChatGLM3-6B-Base 具有在 10B 以下的预训练模型中最强的性能。

  2. 更完整的功能支持:ChatGLM3-6B 采用了全新设计的Prompt 格式,除正常的多轮对话外。同时原生支持工具调用(Function Call)、代码执行(Code Interpreter)和 Agent 任务等复杂场景。

  3. 更全面的开源序列:除了对话模型 ChatGLM3-6B 外,还开源了基础模型 ChatGLM-6B-Base、长文本对话模型 ChatGLM3-6B-32K。

该模型为ChatGLM3系列,支持输入输出token合计是7500,其中单轮最大输出token为1500,单轮最大输入token为6000(如果超过该阈值按最后一次完整的对话进行截断),支持message和prompt格式输入,支持流式调用。


姜子牙通用大模型

模型名称

模型介绍

应用场景

ziya-llama-13b-v1

由IDEA研究院出品的大规模语言模型,它在灵积平台上的模型名称为"ziya-llama-13b-v1"。Ziya-LLaMA大模型V1是基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前Ziya-LLaMA通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。

姜子牙通用大模型V1是大规模预训练语言模型,支持中文英文等不同语言输入。


Dolly开源大语言模型

模型名称

模型介绍

应用场景

dolly-12b-v2

由Databricks出品的大规模语言模型,它在灵积平台上的模型名称为"dolly-12b-v2"。该模型是在pythia-12b的基础上,使用databricks-dolly-15k数据集微调得到的。数据集包括头脑风暴、分类、生成、问答、信息抽取等任务的语料。更多信息可以参考Dolly的开源repo

Dolly超大规模语言模型,支持多语言输入,V2版本是Databricks在pythia-12b的基础上微调得到的12B参数规模大模型。

BELLE开源中文对话大模型

模型名称

模型介绍

应用场景

belle-llama-13b-2m-v1

由BELLE出品的大规模语言模型,它在灵积平台上的模型名称为"belle-llama-13b-2m-v1"。BELLE(BE Large Language Model Engine),一款基于BLOOM和LLAMA针对中文优化、模型调优切仅使用由ChatGPT生成的数据,为中文指令提供更好的支持。

BELLE中文对话大规模语言模型,支持中文英文等不同语言输入。

元语功能型对话大模型V2

模型名称

模型介绍

应用场景

chatyuan-large-v2

是由元语智能出品的大规模语言模型,它在灵积平台上的模型名称为"chatyuan-large-v2"。ChatYuan-large-v2是一个支持中英双语的功能型对话语言大模型,是继ChatYuan系列中ChatYuan-large-v1开源后的又一个开源模型。ChatYuan-large-v2使用了和 v1版本相同的技术方案,在微调数据、人类反馈强化学习、思维链等方面进行了优化。

中英双语大语言模型。

BiLLa开源推理能力增强模型

模型名称

模型介绍

应用场景

billa-7b-sft-v1

开源的推理能力增强的中英双语 LLaMA 模型. 模型的主要特点:

  • 较大提升 LLaMA 的中文理解能力, 并尽可能减少对原始 LLaMA 英文能力的损伤;
  • 训练过程增加较多的任务型数据, 利用 ChatGPT 生成解析, 强化模型理解任务求解逻辑;
  • 全量参数更新, 追求更好的生成效果。

较大提升 LLaMA 的中文理解能力, 并尽可能减少对原始 LLaMA 英文能力的损伤。

以上就是大模型服务平台百炼中提供的模型,平台陆续会上新其他的模型,敬请关注!您可以通过访问大模型服务平台百炼控制台进入模型体验;

登录阿里云账号,访问阿里云百炼控制台,点击模型体验中心,选择需要体验的模型,输入promot,模型返回对应回复。最多支持一次选择3个模型进行对比体验哦~


image.png

同时平台也提供模型的API接口:https://help.aliyun.com/document_detail/2712809.html 访问该内容进行获取调用;


以上内容为本次的全部内容啦,您是否全部掌握了呢?快来一起留言互动打卡吧!


相关文章
|
1月前
|
自然语言处理
阿里云百炼大模型服务--企业知识检索问答指南
阿里云百炼提供的企业知识检索问答应用可以帮助大家实现让大模型瞬间“开挂”的技能。结合上传的知识数据,大模型识别解析学习文档内容,最终给出生成式回复。我们在通义千问-Turbo/Max大模型基础上,将文件上传、读取、切片、向量化等过程都开发好预置在应用中,实现开箱即用,更能满足您的日常需求。
|
2月前
|
人工智能 监控 Cloud Native
阿里云参编业内首个代码大模型标准丨云原生 2024 年 1 月产品技术动态
阿里云参编业内首个代码大模型标准丨云原生 2024 年 1 月产品技术动态
|
1月前
|
人工智能 算法 物联网
阿里云百炼最新能力升级,你都有哪些期待?
阿里云百炼大模型服务产品全新升级,探索算法和技术创新,共享阿里集团内环业务的模型构建经验。
|
13天前
|
监控 Serverless API
阿里云函数计算的工作原理与事件驱动模型密切相关
【4月更文挑战第17天】阿里云函数计算的工作原理与事件驱动模型密切相关
67 4
|
22天前
|
人工智能 自然语言处理 测试技术
“送云资源、用大模型” 阿里云启动云工开物“高校训练营”计划
“送云资源、用大模型” 阿里云启动云工开物“高校训练营”计划
33 1
|
22天前
|
云安全 人工智能 定位技术
交通运输部公路科学研究院携手阿里云共建交通行业大模型
交通运输部公路科学研究院携手阿里云共建交通行业大模型
23 0
|
1月前
|
人工智能 数据可视化 API
阿里云百炼大模型服务--流程编排接入快速上手指南
流程编排是一种面向开发者的可视化开发工具,支持LLM、API、脚本等类型节点,旨在简化接入大型语言模型(LLM)流程,同时提供应用流程的全生命周期管理,包括流程的编排、试验、部署等,为开发者提供自定义AI应用开发一站式服务。
阿里云百炼大模型服务--模型训练指南
模型训练是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果。
|
1月前
|
数据采集 SQL 自然语言处理
阿里云OpenSearch RAG混合检索Embedding模型荣获C-MTEB榜单第一
阿里云OpenSearch引擎通过Dense和Sparse混合检索技术,在中文Embedding模型C-MTEB榜单上拿到第一名,超越Baichuan和众多开源模型,尤其在Retrieval任务上大幅提升。
454 3
|
1月前
|
自然语言处理 算法 关系型数据库
阿里云PAI大模型RAG对话系统最佳实践
本文为大模型RAG对话系统最佳实践,旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术,从而显著提升对话系统的性能,使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践,您可以掌握构建一个大模型RAG对话系统的完整开发链路。