Python之每日一练统计英文文本单词出现的个数、行数、字符数

简介: 第四题:任一个英文的纯文本文件,统计其中的单词出现的个数。一、首先获取纯英文的文本,这里以获取“Python之禅”为例,见代码如下# -*- coding: utf-8 -*-import sysorigin = sys.stdout#标准输出f =open('file.txt', 'w')sys.stdout = f# ===================================print 'Start of program'# 你的程序放到这里,过程中所有print到屏幕的内容都同时保存在file.txt里面了。

第四题:任一个英文的纯文本文件,统计其中的单词出现的个数。

一、首先获取纯英文的文本,这里以获取“Python之禅”为例,见代码如下

# -*- coding: utf-8 -*-

import sys

origin = sys.stdout#标准输出

f =open('file.txt', 'w')

sys.stdout = f

# ===================================

print 'Start of program'

# 你的程序放到这里,过程中所有print到屏幕的内容都同时保存在file.txt里面了。

import this

print 'End of program'

# ===================================

sys.stdout = origin

f.close()

img_c65f78eeae0fe05572a86493ca56892d.png
运行结果

二、输出纯英文文本单词个数

#coding:utf-8

import sys,os

"""

python实现任一个英文的纯文本文件,统计其中的单词出现的个数、行数、字符数

"""

file_name ="file.txt"

line_counts =0    #行数

word_counts =0  #个数

character_counts =0  #字符数

with open(file_name, 'r')as f:

for linein f:

words = line.split()#split()用于分割,分隔符可以自己制定

        line_counts +=1

        word_counts +=len(words)

character_counts +=len(line)

print "line_counts ", line_counts

print "word_counts ", word_counts

print "character_counts ", character_counts

img_be639ea90acd500915ff0fbfb5c980f3.png
运行结果
目录
相关文章
|
算法 前端开发 数据处理
小白学python-深入解析一位字符判定算法
小白学python-深入解析一位字符判定算法
236 0
|
11月前
|
存储 机器学习/深度学习 人工智能
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。
2644 0
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
|
机器学习/深度学习 自然语言处理 API
如何使用阿里云的语音合成服务(TTS)将文本转换为语音?本文详细介绍了从注册账号、获取密钥到编写Python代码调用TTS服务的全过程
如何使用阿里云的语音合成服务(TTS)将文本转换为语音?本文详细介绍了从注册账号、获取密钥到编写Python代码调用TTS服务的全过程。通过简单的代码示例,展示如何将文本转换为自然流畅的语音,适用于有声阅读、智能客服等场景。
5119 3
|
人工智能 Shell 开发工具
[oeasy]python0041_输出ASCII码表_英文字符编码_键盘字符_ISO_646
本文介绍了ASCII码表的生成与使用,包括英文字符、数字和符号的编码。通过Python代码遍历0到127的ASCII值,解决了找不到竖线符号的问题,并解释了ASCII码的固定映射关系及其重要性。文章还介绍了ASCII码的历史背景,以及它如何成为国际标准ISO 646。最后,通过安装`ascii`程序展示了完整的ASCII码表。
283 1
|
自然语言处理 算法 数据挖掘
探讨如何利用Python中的NLP工具,从被动收集到主动分析文本数据的过程
【10月更文挑战第11天】本文介绍了自然语言处理(NLP)在文本分析中的应用,从被动收集到主动分析的过程。通过Python代码示例,详细展示了文本预处理、特征提取、情感分析和主题建模等关键技术,帮助读者理解如何有效利用NLP工具进行文本数据分析。
397 2
|
机器学习/深度学习 自然语言处理 大数据
使用Python进行文本情感分析
【10月更文挑战第2天】使用Python进行文本情感分析
594 3
|
JSON 数据格式 Python
Python实用记录(十四):python统计某个单词在TXT/JSON文件中出现的次数
这篇文章介绍了一个Python脚本,用于统计TXT或JSON文件中特定单词的出现次数。它包含两个函数,分别处理文本和JSON文件,并通过命令行参数接收文件路径、目标单词和文件格式。文章还提供了代码逻辑的解释和示例用法。
554 0
Python实用记录(十四):python统计某个单词在TXT/JSON文件中出现的次数
|
人工智能 开发工具 Python
[oeasy]python040_缩进几个字符好_输出所有键盘字符_循环遍历_indent
本文探讨了Python代码中的缩进问题。通过研究`range`函数和`for`循环,发现缩进对于代码块的执行至关重要。如果缩进不正确,程序会抛出`IndentationError`。文章还介绍了Python的PEP8规范,推荐使用4个空格进行缩进,并通过示例展示了如何使用Tab键实现标准缩进。最后,通过修改代码,输出了从0到122的字符及其对应的ASCII码值,但未能找到竖线符号(`|`)。文章在总结中提到,下次将继续探讨竖线符号的位置。
225 0
|
小程序 IDE 开发工具
Python编写单词复习小程序
Python编写单词复习小程序
243 0