魔搭中文开源模型社区:模型即服务-大模型驱动的自然语言开放生态(上)

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 魔搭中文开源模型社区:模型即服务-

 

作者:黄非阿里巴巴达摩院语言技术实验室研究员

 

一、 层次化预训练模型底座

 

image.png

 

在8月份,阿里巴巴发布了通义预训练模型体系,包括NLP、CV和多模态等模型。在自然语言处理方面,通义Alice Mind预训练模型的底座包括语言理解、生成多语言、多模态等模型。除此之外,通义Alice Mind还有业界广泛应用的模型,比如BERT、GPT、DeBERTa、RoBERTa等等。

 

在此基础上,ModelScope社区针对自然语言,为下游任务提供了文本分类、智能对话翻译、文本纠错等模型。ModelScope社区针对不同行业,丰富了相应的行业模型,方便开发者使用。

 

ModelScope社区通过建立一站式的服务平台,包括模型部署、推理、上线服务,数据集、丰富文档等等,尽可能的方便开发者使用达摩院和其他合作版提供的最先进的模型能力。

 

image.png

 

阿里巴巴自然语言处理的预训练模型Alice Mind,为大家提供了多样模型。其中,通用预训练模型StructBERT,在中文理解CLUE Benchmark榜单上,总榜/分类/阅读理解三榜第一,入选“1o Leading Language Models For NLP In 2021"。

 

与此同时,生成式预训练模型PALM,支持条件式生成模型,在MS MARCO榜单上排名第一。相比中文SOTA,PALM的四个生成任务数据集平均提升1.1个点。

 

超大中文预训练模型PLUG,是首个统一自然语言理解和生成能力的超大中文文本预训练模型(270亿和2万亿参数)。目前,已初步建成PLUG大模型完整服务链路,大模型推理加速10+倍。

 

基于PLUG的多模态预训练模型mPLUG,支持端到端多模态预训练模型,在VQA

Challenge 2021中排名第一,并首次超越人类结果,被MIT Technology Review中国列为核心技术突破。

 

image.png

 

与此同时,阿里云提供的多模态的预训练模型底座mPLUG,充分利用了阿里云的计算环境。mPLUG可以针对于下游任务开发,简单进行一些翻译任务,代码商城、作文写作、百科问答、诗词对联等等。

 

 


相关文章
|
2月前
|
人工智能 负载均衡 数据可视化
10分钟上手全球开源模型冠军 Qwen3
阿里通义千问Qwen3在最新全球AI基准测试中智能水平位列全球前五,开源第一,且成本优势显著,推理成本仅为DeepSeek-R1的1/3、Claude 3.7的1/20。Qwen3支持119种语言,具备强大的代码和数学能力,同时提供思考与非思考两种模式无缝切换,适合复杂与简单任务。通过阿里云百炼平台,用户可在10分钟内快速搭建Qwen3模型服务,结合Cherry Studio客户端实现便捷交互。本文详细介绍了Qwen3的部署、体验及工具调用能力,帮助用户轻松上手。
719 78
|
2月前
|
人工智能 数据挖掘 API
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
234 21
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
|
17天前
|
缓存 自然语言处理 监控
基于通义大模型的智能客服系统构建实战:从模型微调到API部署
本文详细解析了基于通义大模型的智能客服系统构建全流程,涵盖数据准备、模型微调、性能优化及API部署等关键环节。通过实战案例与代码演示,展示了如何针对客服场景优化训练数据、高效微调大模型、解决部署中的延迟与并发问题,以及构建完整的API服务与监控体系。文章还探讨了性能优化进阶技术,如模型量化压缩和缓存策略,并提供了安全与合规实践建议。最终总结显示,微调后模型意图识别准确率提升14.3%,QPS从12.3提升至86.7,延迟降低74%。
183 13
|
2月前
|
Java 数据库 Docker
基于neo4j数据库和dify大模型框架的rag模型搭建
基于neo4j数据库和dify大模型框架的rag模型搭建
419 35
|
2月前
|
机器学习/深度学习 人工智能 算法
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。
156 13
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
|
2月前
|
人工智能 测试技术 API
通义灵码 + 魔搭MCP:全流程构建创空间应用
最近,通义灵码上线 MCP(ModelScope Cloud Platform)功能,从之前代码生成及修改的基础功能,到可以使用MCP服务连接更多功能,开发者可以实现从 代码爬取、模型推理到应用部署
561 26
|
1月前
|
机器学习/深度学习 编解码 缓存
通义万相首尾帧图模型一键生成特效视频!
本文介绍了阿里通义发布的Wan2.1系列模型及其首尾帧生视频功能。该模型采用先进的DiT架构,通过高效的VAE模型降低运算成本,同时利用Full Attention机制确保生成视频的时间与空间一致性。模型训练分为三个阶段,逐步优化首尾帧生成能力及细节复刻效果。此外,文章展示了具体案例,并详细说明了训练和推理优化方法。目前,该模型已开源。
|
1月前
|
机器学习/深度学习 编解码 文字识别
小米又放大招!MiMo-VL 多模态大模型开源,魔搭推理微调全面解读来了!
今天,小米开源发布两款 7B 规模视觉-语言模型 MiMo-VL-7B-SFT 和 MiMo-VL-7B-RL。
287 9

热门文章

最新文章

相关产品

  • 自然语言处理