这个问题已经被人问了不下五遍了, 可见这样的问题,也是大家在工作中经常碰到的。
所以不管怎么样子,我今天找出了一种方法,解决了这个问题。
如果说我们有下面这样一个数据源,当我们导入python进行数据处理后,如果不进行任何处理,会出现什么情况呢?注:编号和身份证列,在Excel中已经是文本类型了。
如果说读取不做任何处理,导出不做任何处理,会出现什么样子的情况呢?
import pandas as pd df = pd.read_excel("info.xlsx") df
结果如下:
这就尴尬了!如果我的数据源中存在这里的列,你去python中跑了一遍,还把我的原始数据给弄得非正常显示了,这不是很无语吗?
这样肯定不行呀,出现了这种问题应该怎么解决呢?
首先看看将这样的数据,读取到python中,怎么正常显示。
import pandas as pd # converters参数,可以指定读取某些列为指定数据类型; df = pd.read_excel("info.xlsx",converters={"身份证":str,"编号":str}) df
结果如下:
通过上图可以发现,数据已经正常读取了。此时,我想导出到excel中的数据,也不出现格式显示问题,应该怎么做呢?
df["编号"] = df["编号"].apply(lambda x: "\t" + x) df["身份证"] = df["身份证"].apply(lambda x: "\t" + x) df.to_csv("info2.csv",encoding="gbk") df.to_excel("info2.xlsx",encoding="gbk")
蹬 蹬 蹬 蹬,你没看错就是这么简单,在每个数据前面加一个制表符\t即可。其实你也可以在数据前面加一个英文状态下的单引号',但是只有加了制表符后,导出excel后,显示的结果是最好的。
现在我们来看看最终的结果: