中文文本纠错模型体验

简介: 中文文本纠错模型体验
  • 中文文本纠错模型体验这个场景非常使用的,尤其是在做文章发布系统平台,这个功能缺一不可,有时候编辑可能发文章的时候,文字会写错,或者其他错误,通过这个,就可以直接定位到哪个文字出现错误,然后告诉你,并纠正。

微信截图_20220923211024.png

中文文本模型描述

  • 中文文本纠错任务是一项NLP基础任务,其输入是一个可能含有语法错误的中文句子,输出是一个正确的中文句子。语法错误类型很多,有多字、少字、错别字等,目前最常见的错误类型是错别字。

模型效果如下:

  • 输入:这洋的话,下一年的福气来到自己身上。
  • 输出:这样的话,下一年的福气就会来到自己身上。

中文文本纠错模型介绍

  • 输入一句中文文本,文本纠错技术对句子中存在拼写、语法、语义等错误进行自动纠正,输出纠正后的文本。主流的方法为seq2seq和seq2edits,常用的数据集包括NLPCC18和CGED等,我们最新的工作提供了高质量、多答案的测试集MuCGEC。
  • 我们在体验平台输入这洋的话,下以年的福气来到自己身上。这段文字,然后点击执行测试

微信图片_20220923210117.png

  • 在这里我们可以看到我们输入的一段文字,其中文字故意写错,通过平台检测,自动识别出来,然后给我替换正确的文字。
{
  "Code": 200,
  "Data": {
    "computation_time": "0.40s",
    "data": {
      "output": "这样的话,下一年的福气会来到自己身上。"
    }
  },
  "Message": "success",
  "RequestId": "f8be9238-3c1f-4e50-8325-101031f64e3d",
  "Success": true
}
  • 这种体检用在自己发布平台,可以大大减少出错体验,确保准确率,保证发稿质量。
  • 中文文本纠错任务就是检测出文本中的错误并且进行纠正,这跟小学语文老师给大家改作文的方式如出一辙,不仅要注明那个位置出错了,还要给出相应的改正措施。中文文本纠错任务包括两部分,一方面是检测任务,一方面是纠正任务,必须同时正确检测到错误的位置并且完成纠正才能算完整的纠错。
相关文章
|
5月前
|
机器学习/深度学习 搜索推荐 安全
语音识别技术是一种将语音信号转换为文本或命令的技术,
语音识别技术是一种将语音信号转换为文本或命令的技术,
|
自然语言处理 知识图谱
中文大模型体验评测
中文大模型体验评测
498 42
|
人工智能 自然语言处理 安全
中文竞技场-中文大模型比比看
今天,大语言模型正在各个应用领域引起巨大的变革,并已经在搜索、金融、办公、安全、教育、游戏、电商、社交媒体等领域迅速普及和应用。例如微软将 GPT4应用于必应搜索引擎和 Office 办公软件。几乎每个企业都试图探索如何将AI融入业务和技术中去。但以中文为主的语言大模型却缺少应有的关注,今天让我们聚焦中文竞技场,看看各种中文大语言模型的表现吧~
63688 1
中文竞技场-中文大模型比比看
|
人工智能 数据挖掘 PyTorch
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
|
自然语言处理 JavaScript Python
中文语言大模型体验小记
中文语言大模型体验小记
214 0
|
6月前
|
机器学习/深度学习 自然语言处理 PyTorch
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必了。
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
|
自然语言处理 PyTorch 算法框架/工具
一键式文本纠错工具,整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型,让您立即享受纠错的便利和效果
一键式文本纠错工具,整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型,让您立即享受纠错的便利和效果
一键式文本纠错工具,整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型,让您立即享受纠错的便利和效果
|
自然语言处理
中文大模型体验
中文大模型体验
217 1
|
人工智能
中文大语言模型的分析
为了体现分析的逻辑性,将会采用序数词排序对三个领域进行报告测评。
225 0
|
机器学习/深度学习 编解码 自然语言处理
错字修改 | 布署1个中文文文本拼蟹纠错模型
错字修改 | 布署1个中文文文本拼蟹纠错模型
307 0