1.Pandas将dateime类型格式化为字符串
Pandas中有很多数据类型,其中有一种是datetime,即日期时间,如Timestamp(‘2020-09-22 20:43:00’),表示其是一个时间戳类型,很多时候需要将其转化为字符串,以便获取到其中的日期或时间,此时可以对其调用strftime()方法,如strftime('%Y-%m-%d')就可以获取到字符串2020-09-22。
在pandas中的DataFrame中,一般是整列替换,此时需要用到lambda表达式和apply方法,如下:
order_detail['date'] = order_detail['date'].apply(lambda x:x.strftime('%Y-%m-%d'))
即可完成将datetime类型转化为指定格式的字符串。
2.Pandas读取.sql文件
pandas读取数据的方式和支持的格式有很多,包括读取数据库数据,但是一般不能直接读取.sql文件,而是一般先执行.sql文件中的SQL语句将数据导入到MySQL数据库中,再使用pandas从数据库中读取数据。
执行.sql文件中的SQL语句一般可以使用数据库可视化工具,如Navicat和SQLYog等,这里以Navicat为例导入.sql文件数据如下:
然后再使用Python从数据库中读取数据,如下:
import pandas as pd import pymysql sql = 'select * from table_name' # 换成自己的表名 con = pymysql.connect(host='127.0.0.1', port=3306,user='root',password='root',database='python_da',charset='gbk') # 换成自己的数据库 order_detail = pd.read_sql(sql,con)
如果没有mymysql库,可以执行pip install pymysql
或者conda install pymysql
进行安装。