编者荐语:
Python 原创大佬的系列文章
呆鸟云:
"""
Python 的数据分析能力已经被大家充分认可了。处理数据的 Pandas,绘制可视图的 Matplotlib,生成交互图的 Bokeh,实现机器学习的 Scikit-learn 等等,Python 数据分析师早就能把这些工具用得出神入化了。但今天呆鸟要和大家聊一聊 Python 数据分析报告的痛点。
"""
用 Python 做数据分析时,这些问题让人很是头疼:
- 用 Python 处理数据,但却要用 Word 写分析报告?头疼
- 用 Excel 分享数据结果,或用 PPT 分享含可视图数据报告?头更疼了
- 用 Jupyter Notebook,效果是好,但人家不会用,也不肯学?无语
- 用 PowerBI 再来个二次开发?继续学起来
- Tableau 是大牛,不过只能试用 14 天,正式版公司不给预算?学了也白搭
- 有些工具不错,但只能把数据放在公共服务器上,虾米?公司不告我,我都得自裁了
不过,告诉大家一个好消息,在一个月黑风高的晚上,呆鸟在一封悄然弹出的 Newsletter 里看到一个蛮有趣的 Python 支持库,研究了一番发现这是个好东西啊,有了它就可以实现好多之前无法实现的功能,比如:
- 用 Python 直接开发 HTML 格式的数据分析报告
- 支持文字、表格、可视图混排,并可实现多行、多列式的仪表盘
- 支持通过网页表单输入参数,自定义筛选感兴趣的数据
- 支持定时、自动生成报告,无需手动干预
- 支持加密分享,可只在团队内部分享,或让指定人员查看
- 学习成本低,上手超快,一两个小时就能自己尝试输出报告了
- 该支持库的作者在官网上声明公众版与团队版均永久免费。是不是很惊喜,是不是很意外?
有了它,再也不用什么 Word、Excel、PPT、PowerBI、Tableau 了,可以直接用 Python 生成 HTML 格式的数据分析报告,在浏览器里就可以让同事查看报告,对他们来说,没有新的学习成本,不用磨破嘴皮子让他们学习 Python 或 BI 工具,也不用担心 Excel 文件被他们搞得乱七八糟,只要打开浏览器就可以轻松上手。在公司内部即可分享,既不用担心数据泄密,也方便了自己。真的是轻轻松松,不再 pain!
当然了,这个支持库还有很多好处,就不在这里一一细说了,因为我已经把该支持库的整个文档都翻译完了,并得到了作者授权,本篇文章之后会一一发出,分享给大家,如果大家喜欢这个支持库,那一定要加关注,我会持续更新的哦。
接下来,简单介绍一下这个支持库的核心功能:
主要函数:
Table
、Plot
、Markdown
save
、publish
Table
函数,直接用 pandas 的 DataFrame 输出交互式表格,顶端显示表格基本信息、可筛选、可搜索、可排序、支持表格分页、也支持一次性加载全部表格、甚至还可以下载表格;
Table
函数还支持 columns
参数,可以输出栅格式的多行、多列的仪表盘。
Plot
函数可以调用 Matplotlib、Bokeh、Altair、Plotly 等支持库输出的可视图,甚至可以保留 Bokeh 等支持库的各种交互功能;
Markdown
函数支持 Markdown,输出格式化文本。
以上这些内容都可以轻松地整合在一个报告页面里,各种模块任你摆放。
save
与publish
用于保存与发布报告
官档译文将详细介绍这些函数与功能,这里就不赘述了。
该支持库分为公众版与团队版,公众版用于在线分享数据报告,Python 数据分析的号主与博主有福了,有了它,无需让读者挑出你的文章,即可查看交互式报告;
团队版其实就是私密版,可以在公司内部的服务器上使用,只有经过授权的人员才能查看,甚至可以更严格的进行私密分享,让只有持有密钥的人才能查看报告。
卖了半天关子,那这个支持库到底是什么呢?Duang、Duang、Duang。。。
它就是 Datapane, 这是它的官网 https://datapane.com/。感兴趣的朋友可以去看它有多简单、但又多强大。还有就是记得关注呆鸟,后续会有完整官档译文哦。