#!/usr/bin/python
# -*- coding: UTF-8 -*-
import pandas as pd
import os
path = r"文件地址"
os.chdir(path)
a = os.listdir()
print (a)
for i in a:
    print ("正在处理: "+i)
    if (os.path.splitext(i)[1]) == (".xls"):
        file = pd.read_excel(i)
        path1 = r"文件地址"
        i = i.split('.')[0] +'.csv'
        filename = path1+'\\'+i
        print ("读取文件: OK")
        file.to_csv(filename,encoding='gbk',index=False)
        print ("保存文件: OK")
        print ("")
 
文件是用'|' 做分隔符的 没有列名 需要提取的列分别在 第一列 跟第六列
本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。 https://developer.aliyun.com/article/706511 点击链接欢迎加入感兴趣的技术领域群
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
可以引用panda库,只需要导入文件,进行数据操作再批量导出就行,这里有阿里云大学panda的教程,希望对你有帮助 https://edu.aliyun.com/course/1798?spm=a2c6h.13066369.0.0.4423546fOvhyMj