一、写在前面
今天给分享的程序是:给一段文字自动加上合适的标点符号,使用的是飞桨
的AI算法模型:auto_punc
,可以智能的分析文字中的情感并在每段文字中加上适合的标点符号。
二、七步精讲
代码我已调试过了,下面是操作步骤:
- 将代码复制到你的py文件中,存放在本地C盘根目录下,名为:
auto_punc.py
; - 安装所需要的Python 模块:
pip install paddlehub
3.准备好要加标点的文字,把文字放在一个 txt中,把txt路径放到代码中相应位置;
4.指定一个保存加好标点的文字的文件路径,路径放到代码中相应位置;
5.Win+R运行cmd,在命令行中输入:python C:/auto_punc.py查看结果;
6.稍等一会后,所有没有加标点的文字,都自动加上了合适的标点;
7.至此,我们就完成了Python 给一段文字自动加上合适的标点符号的程序执行,大家喜欢的记得支持一下,有遇到问题的随时找我沟通。
三、模型介绍
Ernie
是百度
提出的基于知识增强的持续学习语义理解模型,该模型将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇
、结构
、语义
等方面的知识,实现模型效果不断进化。
四、进入实战
1.源代码
''' Paddlehub给一段没有标点符号的文字加上合适的标点符号 ''' # 导入包 import paddlehub as hub model = hub.Module(name='auto_punc', version='1.0.0') # 定义方法 def addpunc(txtpath, savetxt): f = open(txtpath, encoding = "utf-8") # 输出读取到的数据 txtstr = f.read().split("\n") punc_texts = model.add_puncs(txtstr) f.close() str1 = "\n".join(punc_texts) print('转换成功:', str1) with open(savetxt, "a", encoding='utf-8') as fc: fc.write(str1) # 写入文件 fc.write("\n\n") fc.close() if __name__ == '__main__': # 存放要加标点符号的文字 txtpath = r'D:\A\Project_1\source.txt' # 保存加号标点符号的文字 savetxt = r'D:\A\Project_1\punc.txt' # 调用方法 addpunc(txtpath, savetxt)
2.运行效果
(1) cmd方面
cmd的运行效果如下:
(2) txt文件运行前后对比
运行前:
运行后: