日志服务IPython/Jupyter扩展实战：下载数据为Excel文件

2019-02-12 4459

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

对象存储 OSS，20GB 3个月

日志服务 SLS，月写入数据量 50GB 1个月

对象存储 OSS，恶意文件检测 1000次 1年

简介： 想要将日志服务的日志下载并保存为Excel或者CSV格式，并且自动处理字段不一致的情况的话，该怎么办？通过使用日志服务IPython/Jupyter扩展，轻松做到这点。

问题

日志服务的数据并不要求统一格式，每条日志可以有不同的关键字集合，例如:

{"city": "123", "province": "vvv"}
{"city": "shanghai", "pop": "2000"}
{"name": "xiao ming", "home": "shanghai"}

因此一般使用日志服务的CLI下载的命令get_log_all或者pull_log_dump时，格式都是单行JSON格式以保证灵活性。

但是大部分情况下，一个日志库的所有日志的关键字集合总体是稳定的；另一方面，Excel格式（或者更简单的CSV格式）相对JSON更加商业应用和人类操作友好一些。

如果期望下载下来时是Excel或者CSV格式，并且自动处理字段不一致的情况的话，该怎么办？

本文通过使用日志服务IPython/Jupyter扩展，轻松做到这点。

前提

安装日志服务扩展

首先，参考文章日志服务IPythonIPython/Jupyter扩展完成安装（IPython Shell、IPython/Jupyter Notebook或者Jupyter Lab均可）

安装Excel相关组件

在IPython所在环境中安装Excel读写的相关组件：

pip install openpyxl xlrd xlwt XlsxWriter

openpyxl - 用于Excel 2010 xlsx/xlsm文件的读写
xlrd - 读取Exce (xls格式）
xlwt - 写Excel (xls格式）
XlsxWriter - 写Excel (xlsx)文件

配置

使用%manage_log配置好链接日志服务的相关入口、秘钥、项目和日志库等。具体参考这里。

场景

1. 将结果保存到Excel中

通过查询命令%%log查询得到Pandas Dataframe，然后调用to_excel即可。

样例：

%%log -1day ~ now
* | select date_format(date_trunc('hour', __time__), '%H:%i') as dt,
        count(1)%100 as pv,
        round(sum(if(status < 400, 1, 0))*100.0/count(1), 1) AS ratio
        group by date_trunc('hour', __time__)
        order by dt limit 1000

df1 = log_df
df1.to_excel('output.xlsx')

2. 将结果保存到Excel多个Sheet中

通过%log或%%log获得多个数据存在不同的Dataframe中后，如下样例操作：

import pandas as pd
writer = pd.ExcelWriter('output2.xlsx') 

df1.to_excel(writer, sheet_name='data1')
df2.to_excel(writer, sheet_name='data2')

writer.save()

3. 定制Excel细节格式

Pandas默认使用Xlwt模块写xls文件、使用Openpyxl模块写xlsx文件。而使用XlsxWriter写xlsx功能更加全面灵活，但需要如下配置。

例如上面例子中的ExcelWriter构造时，增加参数即可：

writer = pd.ExcelWriter('output2.xlsx', engine='xlsxwriter')

可以定制特定列的格式、样式、甚至直接画Excel图表。具体推荐参考这篇文章。

4. 其他格式

Pandas DataFrame还可以保存其他格式，例如csv、html等，可以进一步参考这里。

进一步参考

日志服务IPythonIPython/Jupyter扩展
Using Excel with pandas
Working with Python Pandas and XlsxWriter
Pandas IO Tools
扫码加入官方钉钉群 (11775223):

日志服务IPython/Jupyter扩展实战：下载数据为Excel文件

问题

前提

安装日志服务扩展

安装Excel相关组件

配置

场景

1. 将结果保存到Excel中

2. 将结果保存到Excel多个Sheet中

3. 定制Excel细节格式

4. 其他格式

进一步参考

云存储

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景