魔搭中文开源模型社区:模型即服务-大模型驱动的自然语言开放生态(下)

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 魔搭中文开源模型社区:模型即服务-

二、 丰富的自然语言算法模型和应用

 

image.png

 

如上图所示,命名实体识别任务(NER)的目的是识别出文本中的核心短语,如新闻领域中的人名、地名、组织名等。在解决实体识别问题中,其核心问题是引入新的信息或知识。

 

阿里云通过获取文本相关的额外知识,来补齐文本中的缺失信息,以此来提升NER的性能。

 

从2021年开始,阿里云提出隐式增强技术,通过动态融合不同预训练模型的知识,NER在六大词法分析任务中,横跨了24个公开数据集,超过业界所有SOTA。

 

在此基础之上,阿里云进一步提出显式上下增强技术,通过检索搜索引擎、相关文本、去躁文本等操作,来进一步提升原始模型的能力。相关工作发表在ACL 2021。

 

在2022年,阿里云再此基础上进行推广,提出的“知识检索技术”在全球规模最大的语义评测SemEval 2022大赛多语言NER的13个赛道中,取得10个第一,并斩获唯一的最佳系统论文奖。

 

image.png

 

在文本分类方面,阿里云基于预训练模型,构建了多维感知器,进行文本分类。多维感知器能够无监督的学习文本中的关键信息,使分类结果更具有可解释性。

 

阿里云多维感知器不仅在中文的自然语言理解任务中,取得了三榜第一。而且把它应用在外呼意图识别、司法分类等环节。目前,ModelScope上相关模型有情感分类、外呼意图识别、零样本分类等等。

 

image.png 

 

如上图所示,阿里云基于对话问答Space序列,上线了意图分类模型。大家可以通过数据扫描,进行意图分类、回复生成、任务推理,代码可复现等等。

 

在表格问答方面,阿里云预制了一些表格问答的预算模型,大家可以直接在ModelScope社区体验。

 

image.png

 

OCR是文字光学字符识别,文档理解非常重要的技术。阿里云将视觉和语言联合建模,通过视觉的二维信息和语言的上下文信息,更好的理解文档或表格中的文字边界,进一步识别文字。

 

image.png

 

与此同时,阿里云对表格结构进行检测与重建,上线了一些基础模型,包括文字检测识别、表格检测识别、中英文表格识别等等。

 

image.png

 

在机器翻译方面,阿里云最新自研的连续语义增强机器翻译模型。获得了自然语言处理顶ACL 2022的最佳论文奖。目前,该模型已开源部署在ModelScope社区。

 

image.png

 

目前,在ModelScope社区上线的机器翻译主要是中英、英中、英法、法英的双向模型。开源模型包含5.7亿参数,翻译质量达到业内第一梯队训练数据包括UN、WMT21、OPUS等,规模达到3亿以上。

 

image.png

 

自然语言理解是从感知智能进化到认知智能的重要阶段,也是形成决策智能的重要基石。阿里云在ModelScope上提供了structBertPALMmPLUG中文基础模型等预训练模型底座,共计100+NLP应用模型。

 

这些模型涵盖了分词,词性,命名实体识别等基础技术,以及文本分类,情感分类,对话问答,OCR机器翻译等应用技术。涵盖了通用,新闻,电商,医疗等多领域。支持中,英,法,西等10多种语言模型。阿里云达摩院为大量的应用场景,提供了丰富易用,性能领先的模型库。

 

相关文章
|
3天前
|
机器学习/深度学习 自然语言处理 PyTorch
从零开始构建nlp情感分析模型!
本教程介绍了如何使用PyTorch和Hugging Face的Transformers库构建一个情感分析模型。主要内容包括导入所需库、读取训练数据集、加载预训练的BERT模型和分词器、定义情感数据集类、划分训练集和验证集、创建数据加载器、设置训练参数、训练模型、评估模型性能以及定义和测试预测函数。通过这些步骤,可以实现一个简单而有效的情感分析模型。
10 2
|
1月前
|
自然语言处理 PyTorch 算法框架/工具
掌握从零到一的进阶攻略:让你轻松成为BERT微调高手——详解模型微调全流程,含实战代码与最佳实践秘籍,助你应对各类NLP挑战!
【10月更文挑战第1天】随着深度学习技术的进步,预训练模型已成为自然语言处理(NLP)领域的常见实践。这些模型通过大规模数据集训练获得通用语言表示,但需进一步微调以适应特定任务。本文通过简化流程和示例代码,介绍了如何选择预训练模型(如BERT),并利用Python库(如Transformers和PyTorch)进行微调。文章详细说明了数据准备、模型初始化、损失函数定义及训练循环等关键步骤,并提供了评估模型性能的方法。希望本文能帮助读者更好地理解和实现模型微调。
62 2
掌握从零到一的进阶攻略:让你轻松成为BERT微调高手——详解模型微调全流程,含实战代码与最佳实践秘籍,助你应对各类NLP挑战!
|
28天前
|
机器学习/深度学习 自然语言处理 并行计算
探索深度学习中的Transformer模型及其在自然语言处理中的应用
【10月更文挑战第6天】探索深度学习中的Transformer模型及其在自然语言处理中的应用
77 0
|
1月前
|
机器学习/深度学习 自然语言处理 异构计算
【NLP自然语言处理】初识深度学习模型Transformer
【NLP自然语言处理】初识深度学习模型Transformer
|
1月前
|
机器学习/深度学习 自然语言处理 算法
【NPL自然语言处理】带你迅速了解传统RNN模型
【NPL自然语言处理】带你迅速了解传统RNN模型
|
3月前
|
机器学习/深度学习 自然语言处理 PyTorch
PyTorch与Hugging Face Transformers:快速构建先进的NLP模型
【8月更文第27天】随着自然语言处理(NLP)技术的快速发展,深度学习模型已经成为了构建高质量NLP应用程序的关键。PyTorch 作为一种强大的深度学习框架,提供了灵活的 API 和高效的性能,非常适合于构建复杂的 NLP 模型。Hugging Face Transformers 库则是目前最流行的预训练模型库之一,它为 PyTorch 提供了大量的预训练模型和工具,极大地简化了模型训练和部署的过程。
156 2
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【深度学习】探讨最新的深度学习算法、模型创新以及在图像识别、自然语言处理等领域的应用进展
深度学习作为人工智能领域的重要分支,近年来在算法、模型以及应用领域都取得了显著的进展。以下将探讨最新的深度学习算法与模型创新,以及它们在图像识别、自然语言处理(NLP)等领域的应用进展。
121 6
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在自然语言处理中的应用与挑战
【10月更文挑战第3天】本文将探讨AI技术在自然语言处理(NLP)领域的应用及其面临的挑战。我们将分析NLP的基本原理,介绍AI技术如何推动NLP的发展,并讨论当前的挑战和未来的趋势。通过本文,读者将了解AI技术在NLP中的重要性,以及如何利用这些技术解决实际问题。
|
2月前
|
机器学习/深度学习 数据采集 自然语言处理
深度学习在自然语言处理中的应用与挑战
本文探讨了深度学习技术在自然语言处理(NLP)领域的应用,包括机器翻译、情感分析和文本生成等方面。同时,讨论了数据质量、模型复杂性和伦理问题等挑战,并提出了未来的研究方向和解决方案。通过综合分析,本文旨在为NLP领域的研究人员和从业者提供有价值的参考。
|
26天前
|
自然语言处理 算法 Python
自然语言处理(NLP)在文本分析中的应用:从「被动收集」到「主动分析」
【10月更文挑战第9天】自然语言处理(NLP)在文本分析中的应用:从「被动收集」到「主动分析」
42 4

相关产品

  • 自然语言处理