某通讯录同步助手pandas数据清洗-阿里云开发者社区

开发者社区> 隐士2018> 正文

某通讯录同步助手pandas数据清洗

简介:
+关注继续查看
'''
因为换手机需要导入通讯录产生的数据清洗需求
使用某通讯录同步助手,产生联系人姓和名的索引问题
导出联系人到本地,选择.csv格式
观察数据,发现'姓'列有一部分是',','名'列也差不多

print(df[['姓','名']]) ==>',' 是NaN
df.fillna({'姓':'','名':''},inplace=True)指定列替换成空
df['姓'] = df['姓'] + df['名'] ==> 将联系人全称合并到'姓'列
df['名'] = '' ==> '名'列为空

注:读取和保存都有使用汉字编码encoding='gbk'
'''

import pandas as pd


df = pd.read_csv('/Users/qyk/Desktop/from_qq.csv',encoding='gbk')

# print(df[['姓','名']])

df.fillna({'姓':'','名':''},inplace=True)
df['姓'] = df['姓'] + df['名']
# print(df['姓'])

df['名'] = '' #此处不可以使用','
print(df[['姓','名']])
# print(df)
df.to_csv('/Users/qyk/Desktop/to_qq.csv',encoding='gbk',index=False) # index=False 否则联系人名后面会跟上索引号的

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
10062 0
趣头条基于 Flink+ClickHouse 构建实时数据分析平台
本文由趣头条数据平台负责人王金海分享,主要介绍趣头条 Flink-to-Hive 小时级场景和 Flink-to-ClickHouse 秒级场景。
3780 0
Android中访问通讯录,数据的增删改查
1.权限 <uses-permission android:name="android.permission.READ_CONTACTS" /> <uses-permission android:name="android.permission.WRITE_CONTACTS" /> 2.通过提供的内容供应商访问通信录(uri) content://com
1133 0
Pandas之三选择数据
介绍在pandas中筛选数据的几种方法,快速定位某行、某列、具体元素的方法
82 0
数据分析工具PANDAS技巧-如何过滤数据
在本文中,我们将介绍在Python中过滤pandas数据帧的各种方法。 数据过滤是最常见的数据操作操作之一。 它类似于SQL中的WHERE子句,或者必须在MS Excel中使用过滤器根据某些条件选择特定行。
2025 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13875 0
如果你还在停服迁移数据,那你就out啦!!
很多数据库提供的原生迁移工具只能进行全量数据拷贝,为了保证迁移数据一致性,要求业务在数据迁移之前需停止服务。所以这种传统的迁移方案对业务影响极大。为降低数据迁移门槛,阿里云数据传输DTS推出不停服迁移功能。使用不停服迁移功能,可实现整个数据迁移过程中,业务停服时间降低到分钟级别
10370 0
+关注
隐士2018
蹭热度,自学AI
325
文章
2
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载