使用python对数据进行计算分析,数据文件一般需要进行导入并处理为可直接使用的格式。
打开: 使用python的内置函数open(),会创建一个file对象。使用该对象的方法可以对文件进行操作。
file_object = open(file_name)
例如 file_object = open('E:\pythonProject\datingTestSet.txt')
对数据处理常使用的方法
读取: file.readlines(),无参数输入
功能:读取所有行并返回列表
该列表使用for...in...结构处理;
字符串处理:
移除:strip()方法,用于移除字符串头尾指定的字符;
语法:str.strip([chars]),chars为指定的字符,
返回新字符串。
分割:split()方法,根据指定分隔符对字符串进行分割。
语法:str.split(),默认为所有的空字符。包括空格,换行(\n),制表符(\t)
返回字符串的分割列表。
访问列表:列表索引从0开始,使用 方括号+索引 直接访问
例如 ...index = 0
for line in file_object.readlines(): # 依次读取每一行
line = line.strip() #去掉每行的头尾空白
list_from_line = line.split('\t')
return_matrix[index,:] = lis_from_line[0:3]
index +=1
file_object.close()
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。