魔搭中文开源模型社区:模型即服务-大模型驱动的自然语言开放生态(上)

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 魔搭中文开源模型社区:模型即服务-

 

作者:黄非阿里巴巴达摩院语言技术实验室研究员

 

一、 层次化预训练模型底座

 

image.png

 

在8月份,阿里巴巴发布了通义预训练模型体系,包括NLP、CV和多模态等模型。在自然语言处理方面,通义Alice Mind预训练模型的底座包括语言理解、生成多语言、多模态等模型。除此之外,通义Alice Mind还有业界广泛应用的模型,比如BERT、GPT、DeBERTa、RoBERTa等等。

 

在此基础上,ModelScope社区针对自然语言,为下游任务提供了文本分类、智能对话翻译、文本纠错等模型。ModelScope社区针对不同行业,丰富了相应的行业模型,方便开发者使用。

 

ModelScope社区通过建立一站式的服务平台,包括模型部署、推理、上线服务,数据集、丰富文档等等,尽可能的方便开发者使用达摩院和其他合作版提供的最先进的模型能力。

 

image.png

 

阿里巴巴自然语言处理的预训练模型Alice Mind,为大家提供了多样模型。其中,通用预训练模型StructBERT,在中文理解CLUE Benchmark榜单上,总榜/分类/阅读理解三榜第一,入选“1o Leading Language Models For NLP In 2021"。

 

与此同时,生成式预训练模型PALM,支持条件式生成模型,在MS MARCO榜单上排名第一。相比中文SOTA,PALM的四个生成任务数据集平均提升1.1个点。

 

超大中文预训练模型PLUG,是首个统一自然语言理解和生成能力的超大中文文本预训练模型(270亿和2万亿参数)。目前,已初步建成PLUG大模型完整服务链路,大模型推理加速10+倍。

 

基于PLUG的多模态预训练模型mPLUG,支持端到端多模态预训练模型,在VQA

Challenge 2021中排名第一,并首次超越人类结果,被MIT Technology Review中国列为核心技术突破。

 

image.png

 

与此同时,阿里云提供的多模态的预训练模型底座mPLUG,充分利用了阿里云的计算环境。mPLUG可以针对于下游任务开发,简单进行一些翻译任务,代码商城、作文写作、百科问答、诗词对联等等。

 

 


相关文章
|
2月前
|
机器学习/深度学习 自然语言处理 PyTorch
PyTorch与Hugging Face Transformers:快速构建先进的NLP模型
【8月更文第27天】随着自然语言处理(NLP)技术的快速发展,深度学习模型已经成为了构建高质量NLP应用程序的关键。PyTorch 作为一种强大的深度学习框架,提供了灵活的 API 和高效的性能,非常适合于构建复杂的 NLP 模型。Hugging Face Transformers 库则是目前最流行的预训练模型库之一,它为 PyTorch 提供了大量的预训练模型和工具,极大地简化了模型训练和部署的过程。
78 2
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】探讨最新的深度学习算法、模型创新以及在图像识别、自然语言处理等领域的应用进展
深度学习作为人工智能领域的重要分支,近年来在算法、模型以及应用领域都取得了显著的进展。以下将探讨最新的深度学习算法与模型创新,以及它们在图像识别、自然语言处理(NLP)等领域的应用进展。
94 6
|
2月前
|
机器学习/深度学习 自然语言处理 数据处理
|
2月前
|
自然语言处理
【NLP】如何实现快速加载gensim word2vec的预训练的词向量模型
本文探讨了如何提高使用gensim库加载word2vec预训练词向量模型的效率,提出了三种解决方案:保存模型以便快速重新加载、仅保存和加载所需词向量、以及使用Embedding工具库代替word2vec原训练权重。
134 2
|
2月前
|
机器学习/深度学习 自然语言处理 并行计算
|
2月前
|
机器学习/深度学习 自然语言处理 PyTorch
【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案--6 提分方案
在讯飞英文学术论文分类挑战赛中的提分技巧和实现方法,包括数据增强、投票融合、伪标签等策略,以及加快模型训练的技巧,如混合精度训练和使用AdamW优化器等。
33 0
|
2月前
|
数据采集 机器学习/深度学习 存储
【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–5 Bert 方案
在讯飞英文学术论文分类挑战赛中使用BERT模型进行文本分类的方法,包括数据预处理、模型微调技巧、长文本处理策略以及通过不同模型和数据增强技术提高准确率的过程。
30 0
|
2月前
|
机器学习/深度学习 数据采集 自然语言处理
【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–4 机器学习LGB 方案
在讯飞英文学术论文分类挑战赛中使用LightGBM模型进行文本分类的方案,包括数据预处理、特征提取、模型训练及多折交叉验证等步骤,并提供了相关的代码实现。
31 0
|
7天前
|
机器学习/深度学习 数据采集 自然语言处理
深度学习在自然语言处理中的应用与挑战
本文探讨了深度学习技术在自然语言处理(NLP)领域的应用,包括机器翻译、情感分析和文本生成等方面。同时,讨论了数据质量、模型复杂性和伦理问题等挑战,并提出了未来的研究方向和解决方案。通过综合分析,本文旨在为NLP领域的研究人员和从业者提供有价值的参考。
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在自然语言处理中的应用
【9月更文挑战第17天】本文主要介绍了AI技术在自然语言处理(NLP)领域的应用,包括文本分类、情感分析、机器翻译和语音识别等方面。通过实例展示了AI技术如何帮助解决NLP中的挑战性问题,并讨论了未来发展趋势。

相关产品

  • 自然语言处理
  • 下一篇
    无影云桌面