中文文本纠错模型体验

简介: 中文文本纠错模型体验
  • 中文文本纠错模型体验这个场景非常使用的,尤其是在做文章发布系统平台,这个功能缺一不可,有时候编辑可能发文章的时候,文字会写错,或者其他错误,通过这个,就可以直接定位到哪个文字出现错误,然后告诉你,并纠正。

微信截图_20220923211024.png

中文文本模型描述

  • 中文文本纠错任务是一项NLP基础任务,其输入是一个可能含有语法错误的中文句子,输出是一个正确的中文句子。语法错误类型很多,有多字、少字、错别字等,目前最常见的错误类型是错别字。

模型效果如下:

  • 输入:这洋的话,下一年的福气来到自己身上。
  • 输出:这样的话,下一年的福气就会来到自己身上。

中文文本纠错模型介绍

  • 输入一句中文文本,文本纠错技术对句子中存在拼写、语法、语义等错误进行自动纠正,输出纠正后的文本。主流的方法为seq2seq和seq2edits,常用的数据集包括NLPCC18和CGED等,我们最新的工作提供了高质量、多答案的测试集MuCGEC。
  • 我们在体验平台输入这洋的话,下以年的福气来到自己身上。这段文字,然后点击执行测试

微信图片_20220923210117.png

  • 在这里我们可以看到我们输入的一段文字,其中文字故意写错,通过平台检测,自动识别出来,然后给我替换正确的文字。
{
  "Code": 200,
  "Data": {
    "computation_time": "0.40s",
    "data": {
      "output": "这样的话,下一年的福气会来到自己身上。"
    }
  },
  "Message": "success",
  "RequestId": "f8be9238-3c1f-4e50-8325-101031f64e3d",
  "Success": true
}
  • 这种体检用在自己发布平台,可以大大减少出错体验,确保准确率,保证发稿质量。
  • 中文文本纠错任务就是检测出文本中的错误并且进行纠正,这跟小学语文老师给大家改作文的方式如出一辙,不仅要注明那个位置出错了,还要给出相应的改正措施。中文文本纠错任务包括两部分,一方面是检测任务,一方面是纠正任务,必须同时正确检测到错误的位置并且完成纠正才能算完整的纠错。
相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
Baichuan-Omni-1.5:百川智能开源全模态理解与生成模型,支持文本、图像、音频和视频的多模态输入和输出
Baichuan-Omni-1.5 是百川智能开源的全模态理解模型,支持文本、图像、音频和视频的多模态输入和输出,显著提升多模态交互体验。
158 22
Baichuan-Omni-1.5:百川智能开源全模态理解与生成模型,支持文本、图像、音频和视频的多模态输入和输出
|
2月前
|
自然语言处理 算法 JavaScript
面向长文本的多模型协作摘要架构:多LLM文本摘要方法
多LLM摘要框架通过生成和评估两个步骤处理长文档,支持集中式和分散式两种策略。每个LLM独立生成文本摘要,集中式方法由单一LLM评估并选择最佳摘要,而分散式方法则由多个LLM共同评估,达成共识。论文提出两阶段流程:先分块摘要,再汇总生成最终摘要。实验结果显示,多LLM框架显著优于单LLM基准,性能提升最高达3倍,且仅需少量LLM和一轮生成评估即可获得显著效果。
90 10
面向长文本的多模型协作摘要架构:多LLM文本摘要方法
|
2月前
|
人工智能 自然语言处理
联通元景:中国联通开源中文原生的文生图模型,优化对中文长文本和成语语义等理解
联通元景(UniT2IXL)是中国联通AI推出的中文原生文生图模型,基于国产昇腾AI平台,优化中文语义理解,支持高质量图像生成。
196 20
联通元景:中国联通开源中文原生的文生图模型,优化对中文长文本和成语语义等理解
|
自然语言处理 知识图谱
中文竞技场模型体验
中文竞技场模型体验
380 0
|
人工智能 数据挖掘 PyTorch
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
|
自然语言处理 UED
中文竞技场大模型体验
中文竞技场大模型体验
|
10月前
|
机器学习/深度学习 编解码 人工智能
OpenAI Sora:“60s超长长度”、“超强语义理解”、“世界模型”。浅析文生视频模型Sora以及技术原理简介
OpenAI,永远快别人一步!!!! 像ChatGPT成功抢了Claude的头条一样,这一次,谷歌核弹级大杀器Gemini 1.5才推出没几个小时,全世界的目光就被OpenAI的Sora抢了去。 100万token的上下文,仅靠一本语法书就学会了一门全新的语言,如此震撼的技术进步,在Sora的荣光下被衬得暗淡无光,着实令人唏嘘。 三个词总结 “60s超长长度”、“单视频多角度镜头”,“世界模型”
378 0
OpenAI Sora:“60s超长长度”、“超强语义理解”、“世界模型”。浅析文生视频模型Sora以及技术原理简介
|
自然语言处理 JavaScript Python
中文语言大模型体验小记
中文语言大模型体验小记
235 0
|
存储 自然语言处理 并行计算
bert中文文本摘要代码(3)
bert中文文本摘要代码(3)
151 0
bert中文文本摘要代码(3)
|
自然语言处理 PyTorch 算法框架/工具
一键式文本纠错工具,整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型,让您立即享受纠错的便利和效果
一键式文本纠错工具,整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型,让您立即享受纠错的便利和效果
一键式文本纠错工具,整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型,让您立即享受纠错的便利和效果