【Python初级人工智能精讲】用Paddlehub给一段没有标点符号的文字加上合适的标点符号

简介: 今天给分享的程序是:给一段文字自动加上合适的标点符号,使用的是飞桨的AI算法模型:auto_punc,可以智能的分析文字中的情感并在每段文字中加上适合的标点符号。

一、写在前面

今天给分享的程序是:给一段文字自动加上合适的标点符号,使用的是飞桨的AI算法模型:auto_punc,可以智能的分析文字中的情感并在每段文字中加上适合的标点符号。

二、七步精讲

代码我已调试过了,下面是操作步骤:

  1. 将代码复制到你的py文件中,存放在本地C盘根目录下,名为:auto_punc.py
  2. 安装所需要的Python 模块:
pip install paddlehub

3.准备好要加标点的文字,把文字放在一个 txt中,把txt路径放到代码中相应位置;

4.指定一个保存加好标点的文字的文件路径,路径放到代码中相应位置;

5.Win+R运行cmd,在命令行中输入:python C:/auto_punc.py查看结果;

6.稍等一会后,所有没有加标点的文字,都自动加上了合适的标点;

7.至此,我们就完成了Python 给一段文字自动加上合适的标点符号的程序执行,大家喜欢的记得支持一下,有遇到问题的随时找我沟通。

三、模型介绍

Ernie百度提出的基于知识增强的持续学习语义理解模型,该模型将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇结构语义等方面的知识,实现模型效果不断进化。

四、进入实战

1.源代码

'''
Paddlehub给一段没有标点符号的文字加上合适的标点符号
'''
# 导入包
import paddlehub as hub
model = hub.Module(name='auto_punc', version='1.0.0')
# 定义方法
def addpunc(txtpath, savetxt):
    f = open(txtpath, encoding = "utf-8")
    # 输出读取到的数据
    txtstr = f.read().split("\n")
    punc_texts = model.add_puncs(txtstr)
    f.close()
    str1 = "\n".join(punc_texts)
    print('转换成功:', str1)
    with open(savetxt, "a", encoding='utf-8') as fc:
        fc.write(str1)  # 写入文件
        fc.write("\n\n")
        fc.close()
if __name__ == '__main__':
    # 存放要加标点符号的文字
    txtpath = r'D:\A\Project_1\source.txt'
    # 保存加号标点符号的文字
    savetxt = r'D:\A\Project_1\punc.txt'
    # 调用方法
    addpunc(txtpath, savetxt)

2.运行效果

(1) cmd方面

cmd的运行效果如下:

(2) txt文件运行前后对比

运行前:




运行后:



相关文章
|
1天前
|
数据挖掘 数据安全/隐私保护 开发者
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
132 0
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
【专栏】Python在人工智能领域的应用现状、优势及未来趋势
【4月更文挑战第27天】本文探讨了Python在人工智能领域的应用现状、优势及未来趋势。Python作为数据科学、机器学习、深度学习和自然语言处理的首选语言,拥有丰富的库如NumPy、Pandas、TensorFlow和NLTK等。其简洁易学、跨平台和活跃社区等特点促进了AI的普及和发展。未来,Python将在强化深度学习、融合新兴技术、提高可解释性和人才培养等方面持续发挥关键作用。
|
1天前
|
机器学习/深度学习 人工智能 自动驾驶
人工智能:原理、应用与Python代码实现
人工智能:原理、应用与Python代码实现
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能:原理、应用与Python代码示例
人工智能:原理、应用与Python代码示例
|
1天前
|
机器学习/深度学习 人工智能 算法框架/工具
Python人工智能与机器学习
【4月更文挑战第11天】Python在AI和ML领域占主导地位,得益于其简洁语法、强大库支持和活跃社区。关键应用包括数据预处理(Pandas, NumPy)、模型训练(scikit-learn, TensorFlow, PyTorch)、深度学习、NLP(NLTK, spaCy, Transformers)和计算机视觉(OpenCV, Pillow)。丰富的库如NumPy、Pandas、Matplotlib等,以及学习资源,使Python成为AI和ML的理想选择。
497 5
|
1天前
|
机器学习/深度学习 人工智能 算法
|
1天前
|
机器学习/深度学习 人工智能 数据挖掘
Python人工智能基础知识:理解神经网络与机器学习的基本概念
Python人工智能基础知识:理解神经网络与机器学习的基本概念
27 1
|
1天前
|
机器学习/深度学习 人工智能 算法
从零开始学习Python人工智能:神经网络和机器学习入门指南
从零开始学习Python人工智能:神经网络和机器学习入门指南
44 4
|
1天前
|
文字识别 数据挖掘 网络安全
Python实现avif图片转jpg格式并识别图片中的文字
在做数据分析的时候有些数据是从图片上去获取的,这就需要去识别图片上的文字。Python有很多库可以很方便的实现OCR识别图片中的文字。这里介绍用EasyOCR库进行图片文字识别。easyocr是一个比较流行的库,支持超过80种语言,识别率高,速度也比较快。
38 2
|
1天前
|
机器学习/深度学习 文字识别 数据安全/隐私保护
Python实现从PDF和图片提取文字的方法总结
Python实现从PDF和图片提取文字的方法总结
79 0

热门文章

最新文章