阿里云百炼的模型怎么选择并体验

简介: 本模块为您提供大模型服务平台百炼中支持的模型类型,便于您快速根据自己的需求选择所需模型!

什么是大模型服务平台百炼

大模型服务平台百炼是一站式的企业专属大模型生产平台,基于通义基础大模型,提供企业专属大模型开发和应用的整套工具链。

  • 面向对象:企业、开发者及ISV的技术人员。
  • 核心能力:支持开箱即用的应用调用,大模型训练微调和一站式在线灵活部署。
  • 服务形式:通过API服务输出给客户,方便客户进行集成和使用专属大模型能力。
  • 应用编排:支持客户打通自己的业务能力API,使得客户可以将专属大模型能力结合进入自己的业务链路。

大模型服务平台百炼都提供哪些模型

大模型服务平台百炼不仅提供通义系列开源、闭源模型,还提供了第三方专属大模型,下面我们一起看看有哪些模型吧!

通义千问系列

说明:模型限流和免费额度请点击链接查看完整信息。

模型名称

模型介绍

应用场景

qwen-turbo 通义千问超大规模语言模型,支持中文、英文等不同语言输入。
  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

  • 翻译服务:提供各类语言的翻译服务,如英语、日语、法语或西班牙语等。

  • 对话模拟:扮演不同角色进行交互式对话。

  • 数据可视化:图表制作和数据呈现等。

qwen-plus 通义千问超大规模语言模型增强版,支持中文、英文等不同语言输入。
qwen-max 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。

qwen-max-1201

将于2024年4月22日下线

通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。
qwen-max-longcontext 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。
qwen-vl-plus 通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能。
  • 看图做题;

  • 图文识别;

  • 增强分辨率;

qwen-vl-max 通义千问超大规模视觉语言模型。相比增强版,再次提升视觉推理能力和指令遵循能力,提供更高的视觉感知和认知水平。在更多复杂任务上提供最佳的性能。


通义千问开源系列

说明:模型限流和免费额度请点击链接查看完整信息。

模型名称

模型介绍

应用场景

qwen-vl-v1

以 Qwen-7B 语言模型初始化,添加图像模型,图像输入分辨率为448的预训练模型。
  • 支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;

  • 支持多图输入和比较,指定图片问答,多图文学创作等;

  • 通过中文开放域语言表达进行检测框标注;

qwen-vl-chat-v1 通义千问VL支持灵活的交互方式,包括多图、多轮问答、创作等能力的模型。
qwen1.5-72b-chat 通义千问1.5对外开源的72B规模参数量的经过人类指令对齐的chat模型。
  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

qwen-72b-chat 通义千问对外开源的72B规模参数量的经过人类指令对齐的chat模型。
qwen-14b-chat 通义千问对外开源的14B规模参数量的经过人类指令对齐的chat模型。
qwen1.5-14b-chat 通义千问1.5对外开源的14B规模参数量的经过人类指令对齐的chat模型。
qwen1.5-7b-chat 通义千问1.5对外开源的7B规模参数量是经过人类指令对齐的chat模型。
qwen-7b-chat 通义千问对外开源的7B规模参数量的经过人类指令对齐的chat模型。
qwen-1.8b-longcontext-chat 通义千问对外开源的1.8B规模参数量的经过人类指令对齐的chat模型。
qwen-1.8b-chat 通义千问对外开源的1.8B规模参数量的经过人类指令对齐的chat模型。


通义万象系列

说明:模型限流和免费额度请点击链接查看完整信息。

模型名称

模型介绍

应用场景

wanx-v1 基于自研的Composer组合生成框架的AI绘画创作大模型,能够根据用户输入的文字内容,生成符合语义描述的不同风格的图像。通过知识重组与可变维度扩散模型,加速收敛并提升最终生成图片的效果, 结果自然、细节丰富。支持中英文双语输入。


  • 包括但不限于:水彩、油画、中国画、素描、扁平插画、二次元、3D卡通
wanx-style-repaint-v1 将输入的人物图像进行多种风格化的重绘生成,使新生成的图像在兼顾原始人物相貌的同时,带来不同风格的绘画效果。当前支持的风格有:复古漫画、3D童话、二次元、小清新、未来科技等。
  • 支持的风格有:复古漫画、3D童话、二次元、小清新、未来科技等。
wanx-background-generation-v2 可以基于输入的前景图像素材拓展生成背景信息,实现自然的光影融合效果,与细腻的写实画面生成。
  • 支持文本描述、图像引导等多种方式,同时支持对生成的图像智能添加文字内容。
  • 支持通用、家居和美妆分场景的多个预设模型。
  • 支持边缘引导元素生成,指定背景生成图片里有前景和背景特定内容元素引导生成。
wanx-sketch-to-image-lite 通义万相-涂鸦作画通过手绘任意内容加文字描述,即可生成精美的涂鸦绘画作品,作品中的内容在参考手绘线条的同时,兼顾创意性和趣味性。涂鸦作画支持扁平插画、油画、二次元、3D卡通和水彩5种风格,可用于创意娱乐、辅助设计、儿童教学等场景。
  • 通过手绘任意内容加文字描述,即可生成精美的涂鸦绘画作品,作品中的内容在参考手绘线条的同时,兼顾创意性和趣味性。

通用文本向量模型

说明:模型限流和免费额度请点击链接查看完整信息。

模型名称

模型介绍

应用场景

text-embedding-v1 支持多语种输出,包含中文、英语、西班牙语、法语、葡萄牙语、印尼语。
  • 多语言输出;

  • 自然语言翻译;

text-embedding-v2 支持多语种输出,包含中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语。

text-embedding-async-v1

支持多种语种输出,包含中文、英语、西班牙语、法语、葡萄牙语、印尼语。
text-embedding-async-v2 支持多种语种输出,包含中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语。

三方开源大模型

说明:模型限流和免费额度请点击链接查看完整信息。


Llama2大语言模型

模型名称

模型介绍

应用场景

llama2-7b-chat-v2

来自Meta开发并公开发布的大型语言模型(LLMs)。

该系列模型提供了多种参数大小(7B、13B和70B等)的版本,并同时提供了预训练和针对对话场景的微调版本。 Llama 2系列使用了2T token进行训练,相比于LLama多出40%,上下文长度从LLama的2048升级到4096,可以理解更长的文本, 在多个公开基准测试上超过了已有的开源模型。 采用了高质量的数据进行微调和基于人工反馈的强化学习训练,具有较高的可靠性和安全性。

阿里云百炼提供的llama2-7b-chat-v2和llama2-13b-chat-v2,分别为7B和13B规模的LLaMa2模型,针对对话场景微调优化后的版本。
llama2-13b-chat-v2

百川模型

模型名称

模型介绍

应用场景

baichuan2-7b-chat-v1

baichuan-13B/baichuan2-7B是由百川智能开发的一个开源的大规模预训练模型。基于Transformer结构,在大约1.2万亿tokens上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。

百川模型2-7B对话版/百川模型2-13B对话版,支持message和prompt格式输入。
baichuan2-13b-chat-v1
baichuan-7b-v1

仅支持prompt格式输入。

MOSS开源对话语言模型

模型名称

模型介绍

应用场景

moss-moon-003-sft MOSS-MOON-003-SFT模型是复旦大学出品的大规模语言模型,它在灵积平台上的模型名称为"moss-moon-003-sft-v1"。MOSS是一个支持中英双语和多种插件的开源对话语言模型,MOSS-MOON系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 支持中英双语和多种插件的开源对话语言模型。
moss-moon-003-base


ChatGLM开源双语对话语言模型


模型名称

模型介绍

应用场景

chatglm-6b-v2

ChatGLM2是开源中英双语对话模型ChatGLM-6B的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B引入了如下新特性:

  1. 更强大的性能:基于 ChatGLM 初代模型的开发经验,全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了GLM的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。
  2. 更长的上下文:基于FlashAttention技术,将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,会在后续迭代升级中着重进行优化。
  3. 更高效的推理:基于Multi-Query Attention技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。
该模型为ChatGLM2系列,仅支持prompt格式输入。
chatglm3-6b

ChatGLM3是ChatGLM 系列最新一代的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B 引入了如下特性:

  1. 更强大的基础模型:ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示,ChatGLM3-6B-Base 具有在 10B 以下的预训练模型中最强的性能。

  2. 更完整的功能支持:ChatGLM3-6B 采用了全新设计的Prompt 格式,除正常的多轮对话外。同时原生支持工具调用(Function Call)、代码执行(Code Interpreter)和 Agent 任务等复杂场景。

  3. 更全面的开源序列:除了对话模型 ChatGLM3-6B 外,还开源了基础模型 ChatGLM-6B-Base、长文本对话模型 ChatGLM3-6B-32K。

该模型为ChatGLM3系列,支持输入输出token合计是7500,其中单轮最大输出token为1500,单轮最大输入token为6000(如果超过该阈值按最后一次完整的对话进行截断),支持message和prompt格式输入,支持流式调用。


姜子牙通用大模型

模型名称

模型介绍

应用场景

ziya-llama-13b-v1

由IDEA研究院出品的大规模语言模型,它在灵积平台上的模型名称为"ziya-llama-13b-v1"。Ziya-LLaMA大模型V1是基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前Ziya-LLaMA通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。

姜子牙通用大模型V1是大规模预训练语言模型,支持中文英文等不同语言输入。


Dolly开源大语言模型

模型名称

模型介绍

应用场景

dolly-12b-v2

由Databricks出品的大规模语言模型,它在灵积平台上的模型名称为"dolly-12b-v2"。该模型是在pythia-12b的基础上,使用databricks-dolly-15k数据集微调得到的。数据集包括头脑风暴、分类、生成、问答、信息抽取等任务的语料。更多信息可以参考Dolly的开源repo

Dolly超大规模语言模型,支持多语言输入,V2版本是Databricks在pythia-12b的基础上微调得到的12B参数规模大模型。

BELLE开源中文对话大模型

模型名称

模型介绍

应用场景

belle-llama-13b-2m-v1

由BELLE出品的大规模语言模型,它在灵积平台上的模型名称为"belle-llama-13b-2m-v1"。BELLE(BE Large Language Model Engine),一款基于BLOOM和LLAMA针对中文优化、模型调优切仅使用由ChatGPT生成的数据,为中文指令提供更好的支持。

BELLE中文对话大规模语言模型,支持中文英文等不同语言输入。

元语功能型对话大模型V2

模型名称

模型介绍

应用场景

chatyuan-large-v2

是由元语智能出品的大规模语言模型,它在灵积平台上的模型名称为"chatyuan-large-v2"。ChatYuan-large-v2是一个支持中英双语的功能型对话语言大模型,是继ChatYuan系列中ChatYuan-large-v1开源后的又一个开源模型。ChatYuan-large-v2使用了和 v1版本相同的技术方案,在微调数据、人类反馈强化学习、思维链等方面进行了优化。

中英双语大语言模型。

BiLLa开源推理能力增强模型

模型名称

模型介绍

应用场景

billa-7b-sft-v1

开源的推理能力增强的中英双语 LLaMA 模型. 模型的主要特点:

  • 较大提升 LLaMA 的中文理解能力, 并尽可能减少对原始 LLaMA 英文能力的损伤;
  • 训练过程增加较多的任务型数据, 利用 ChatGPT 生成解析, 强化模型理解任务求解逻辑;
  • 全量参数更新, 追求更好的生成效果。

较大提升 LLaMA 的中文理解能力, 并尽可能减少对原始 LLaMA 英文能力的损伤。

以上就是大模型服务平台百炼中提供的模型,平台陆续会上新其他的模型,敬请关注!您可以通过访问大模型服务平台百炼控制台进入模型体验;

登录阿里云账号,访问阿里云百炼控制台,点击模型体验中心,选择需要体验的模型,输入promot,模型返回对应回复。最多支持一次选择3个模型进行对比体验哦~


image.png

同时平台也提供模型的API接口:https://help.aliyun.com/document_detail/2712809.html 访问该内容进行获取调用;


以上内容为本次的全部内容啦,您是否全部掌握了呢?快来一起留言互动打卡吧!


相关文章
|
7天前
|
SQL 存储 调度
从 Volcano 火山模型到 Pipeline 执行模型,阿里云数据库 SelectDB 内核 Apache Doris 执行模型的迭代
一个合适的执行模型对于提高查询效率和系统性能至关重要。本文全面剖析 Apache Doris Pipeline 执行模型的设计与改造历程,并在 2.1 版本对并发执行模式与调度模式进一步优化,解决了执行并发受限、执行及调度开销大等问题。
从 Volcano 火山模型到 Pipeline 执行模型,阿里云数据库 SelectDB 内核 Apache Doris 执行模型的迭代
|
1天前
|
安全 API 语音技术
阿里云百炼大模型服务平台是什么
阿里云百炼大模型服务平台是一个为企业提供一站式专属大模型生产与应用的平台,支持多样化模型和自定义编排。平台提供即插即用的智能工具箱,包括API接口、模型微调及部署功能,同时具备流程编排以适应复杂业务场景。此外,平台内置多种工具和插件,支持Python等,允许企业集成自定义API。平台优势在于快速构建业务应用、多行业大模型,以及保障模型效果的三大核心竞争力。它还提供丰富的模型服务,如通义千问模型用于文字创作、翻译等,通义万相模型用于图像生成,以及语音合成和识别模型等。企业可通过标准API和SDK进行集成,确保高效安全。
|
8天前
|
弹性计算 API Python
阿里云百炼应用之流程编排
阿里云通义百炼平台流程编排使用教程。
|
8天前
|
存储 自然语言处理 算法
阿里云百炼之RAG算法能力分享会来喽|速来围观~
阿里云百炼是基于通义大模型、行业大模型以及三方大模型的一站式大模型开发平台。提供完整的模型训练工具和全链路开发套件,预置丰富的应用插件,提供便捷的集成方式,结合企业专属数据和API,帮企业高效完成大模型应用构建。RAG检索增强应用是在通义千问-Max大模型基础之上,专项增强「基于知识检索的大模型生成能力」,支持基于结构化/非结构化内容的文字生成场景。
|
8天前
|
监控 Serverless API
阿里云函数计算的工作原理与事件驱动模型密切相关
【4月更文挑战第17天】阿里云函数计算的工作原理与事件驱动模型密切相关
73 4
|
8天前
|
机器学习/深度学习 人工智能 安全
AI战略丨阿里云百炼再升级:模型、工具、AI能力,快速接入、应有尽有
阿里云百炼持续加码模型服务,基于丰富的底层计算能力与通义系列模型的最佳实践,构建训练评测、标注、部署全生命周期模型工具,帮助企业、开发者在云上一站式调用、优化大模型,成为大模型时代的商业化基础设施。
阿里云百炼商业化升级公告
阿里云百炼大模型于2024年3月15日完成商业化升级,本次商品升级后不影响计费价格,调用方式和服务也不会改变和中断,无需手动操作。
|
8天前
|
人工智能 自然语言处理 测试技术
“送云资源、用大模型” 阿里云启动云工开物“高校训练营”计划
“送云资源、用大模型” 阿里云启动云工开物“高校训练营”计划
44 1
|
8天前
|
云安全 人工智能 定位技术
交通运输部公路科学研究院携手阿里云共建交通行业大模型
交通运输部公路科学研究院携手阿里云共建交通行业大模型
37 0
|
8天前
|
弹性计算 运维 监控
解密阿里云弹性计算:探索云服务器ECS的核心功能
阿里云ECS是核心计算服务,提供弹性云服务器资源,支持实例按需配置、集群管理和监控,集成安全防护,确保服务稳定、安全,助力高效业务运营。
260 0

热门文章

最新文章