用Python自动生成图文并茂的数据分析报告-阿里云开发者社区

用Python自动生成图文并茂的数据分析报告

2022-08-09 862

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 高级~！

大家好，这里是程序员晚枫。

上周B站：程序员晚枫后台的一位朋读者私信我，想学习一下Python自动化生成数据分析报告。

作为有问必答的编程博主，今天我们来一起学习一下~

reportlab是Python的一个标准库，可以画图、画表格、编辑文字，最后可以输出PDF格式。它的逻辑和编辑一个word文档或者PPT很像。有两种方法：

建立一个空白文档，然后在上面写文字、画图等；
建立一个空白list，以填充表格的形式插入各种文本框、图片等，最后生成PDF文档。

因为需要产生一份给用户看的报告，里面需要插入图片、表格等，所以采用的是第二种方法。

1、一行命令，安装这个库

reportlab输入Python的第三方库，使用前需要先安装，

为了方便大家使用，我已经将这个库集成到Python自动化办公的专用库：pip install python-office中了，

因此一行命令就可以完成的安装命令如下👇

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-office -U

2、核心代码模块导入

①提前导入相关内容，并且注册字体。（注册字体前需要先准备好字体文件）

from reportlab.pdfbase import pdfmetrics   # 注册字体
from reportlab.pdfbase.ttfonts import TTFont # 字体类
from reportlab.platypus import Table, SimpleDocTemplate, Paragraph, Image  # 报告内容相关类
from reportlab.lib.pagesizes import letter  # 页面的标志尺寸(8.5*inch, 11*inch)
from reportlab.lib.styles import getSampleStyleSheet  # 文本样式
from reportlab.lib import colors  # 颜色模块
from reportlab.graphics.charts.barcharts import VerticalBarChart  # 图表类
from reportlab.graphics.charts.legends import Legend  # 图例类
from reportlab.graphics.shapes import Drawing  # 绘图工具
from reportlab.lib.units import cm  # 单位：cm

②注册字体

提前准备好字体文件, 如果同一个文件需要多种字体可以注册多个

pdfmetrics.registerFont(TTFont('SimSun', 'SimSun.ttf'))
封装不同内容对应的函数
创建一个Graphs类，通过不同的静态方法提供不同的报告内容，包括：标题、普通段落、图片、表格和图表。函数中的相关数据目前绝大多数都是固定值，可以根据情况自行设置成相关参数。
# Graphs类的全部代码

class Graphs:
    # 绘制标题
    @staticmethod
    def draw_title(title: str):
        # 获取所有样式表
        style = getSampleStyleSheet()
        # 拿到标题样式
        ct = style['Heading1']
        # 单独设置样式相关属性
        ct.fontName = 'VeraBd'  # 字体名
        ct.fontSize = 18  # 字体大小
        ct.leading = 50  # 行间距
        ct.textColor = colors.green  # 字体颜色
        ct.alignment = 1  # 居中
        ct.bold = True
        # 创建标题对应的段落，并且返回
        return Paragraph(title, ct)

        # 绘制小标题

    @staticmethod
    def draw_little_title(title: str):
        # 获取所有样式表
        style = getSampleStyleSheet()
        # 拿到标题样式
        ct = style['Normal']
        # 单独设置样式相关属性
        ct.fontName = 'VeraBd'  # 字体名
        ct.fontSize = 15  # 字体大小
        ct.leading = 30  # 行间距
        ct.textColor = colors.red  # 字体颜色
        # 创建标题对应的段落，并且返回
        return Paragraph(title, ct)

        # 绘制普通段落内容

    @staticmethod
    def draw_text(text: str):
        # 获取所有样式表
        style = getSampleStyleSheet()
        # 获取普通样式
        ct = style['Normal']
        ct.fontName = 'VeraBd'
        ct.fontSize = 12
        ct.wordWrap = 'CJK'  # 设置自动换行
        ct.alignment = 0  # 左对齐
        ct.firstLineIndent = 32  # 第一行开头空格
        ct.leading = 25
        return Paragraph(text, ct)

        # 绘制表格

    @staticmethod
    def draw_table(*args):
        # 列宽度
        col_width = 120
        style = [
            ('FONTNAME', (0, 0), (-1, -1), 'VeraBd'),  # 字体
            ('FONTSIZE', (0, 0), (-1, 0), 12),  # 第一行的字体大小
            ('FONTSIZE', (0, 1), (-1, -1), 10),  # 第二行到最后一行的字体大小
            ('BACKGROUND', (0, 0), (-1, 0), '#d5dae6'),  # 设置第一行背景颜色
            ('ALIGN', (0, 0), (-1, -1), 'CENTER'),  # 第一行水平居中
            ('ALIGN', (0, 1), (-1, -1), 'LEFT'),  # 第二行到最后一行左右左对齐
            ('VALIGN', (0, 0), (-1, -1), 'MIDDLE'),  # 所有表格上下居中对齐
            ('TEXTCOLOR', (0, 0), (-1, -1), colors.darkslategray),  # 设置表格内文字颜色
            ('GRID', (0, 0), (-1, -1), 0.5, colors.grey),  # 设置表格框线为grey色，线宽为0.5
            # ('SPAN', (0, 1), (0, 2)),  # 合并第一列二三行
            # ('SPAN', (0, 3), (0, 4)),  # 合并第一列三四行
            # ('SPAN', (0, 5), (0, 6)),  # 合并第一列五六行
            # ('SPAN', (0, 7), (0, 8)),  # 合并第一列五六行
        ]
        table = Table(args, colWidths=col_width, style=style)
        return table

        # 创建图表

    @staticmethod
    def draw_bar(bar_data: list, ax: list, items: list):
        drawing = Drawing(500, 250)
        bc = VerticalBarChart()
        bc.x = 45  # 整个图表的x坐标
        bc.y = 45  # 整个图表的y坐标
        bc.height = 200  # 图表的高度
        bc.width = 350  # 图表的宽度
        bc.data = bar_data
        bc.strokeColor = colors.black  # 顶部和右边轴线的颜色
        bc.valueAxis.valueMin = 5000  # 设置y坐标的最小值
        bc.valueAxis.valueMax = 26000  # 设置y坐标的最大值
        bc.valueAxis.valueStep = 2000  # 设置y坐标的步长
        bc.categoryAxis.labels.dx = 2
        bc.categoryAxis.labels.dy = -8
        bc.categoryAxis.labels.angle = 20
        bc.categoryAxis.categoryNames = ax

        # 图示
        leg = Legend()
        leg.fontName = 'VeraBd'
        leg.alignment = 'right'
        leg.boxAnchor = 'ne'
        leg.x = 475  # 图例的x坐标
        leg.y = 240
        leg.dxTextSpace = 10
        leg.columnMaximum = 3
        leg.colorNamePairs = items
        drawing.add(leg)
        drawing.add(bc)
        return drawing

        # 绘制图片

    @staticmethod
    def draw_img(path):
        img = Image(path)  # 读取指定路径下的图片
        img.drawWidth = 20 * cm  # 设置图片的宽度
        img.drawHeight = 8 * cm  # 设置图片的高度
        return img

③生成报告

if __name__ == '__main__':  
    # 创建内容对应的空列表  
    content = list()  
    
    # 添加标题   
    content.append(Graphs.draw_title('数据分析就业薪资'))   
    
    # 添加图片   
    content.append(Graphs.draw_img('资料全集.jpg'))  
    
    # 添加段落文字  
    content.append(Graphs.draw_text('众所周知，大数据分析师岗位是香饽饽，近几年数据分析热席卷了整个互联网行业，与数据分析的相关的岗位招聘、培训数不胜数。很多人前赴后继，想要参与到这波红利当中。那么数据分析师就业前景到底怎么样呢？需要学习Python + 大数据分析，可以添加我：CoderWanFeng'))   
    
    # 添加小标题  
    content.append(Graphs.draw_title(''))  
    content.append(Graphs.draw_little_title('全网同名：程序员晚枫'))   
    
    # 添加表格   
    data = [    
        ('平台名称', '关注人数', '较上年增长率'),    
        ('公众号', '18.5K', '25%'),     
        ('B站', '25.5K', '14%'),    
        ('微博', '29.3K', '10%') 
    ]  
    content.append(Graphs.draw_table(*data)) 
    
    # 生成图表  
    content.append(Graphs.draw_title(''))  
    content.append(Graphs.draw_little_title('热门城市的就业情况'))  
    b_data = [(25400, 12900, 20100, 20300, 20300, 17400), (15800, 9700, 12982, 9283, 13900, 7623)]  
    ax_data = ['BeiJing', 'ChengDu', 'ShenZhen', 'ShangHai', 'HangZhou', 'NanJing'] 
    leg_items = [(colors.red, '平均薪资'), (colors.green, '招聘量')]   
    content.append(Graphs.draw_bar(b_data, ax_data, leg_items))  
    
    # 生成pdf文件   
    doc = SimpleDocTemplate('report.pdf', pagesize=letter)  
    doc.build(content)

生成报告的结果如下

用Python自动生成图文并茂的数据分析报告

1、一行命令，安装这个库

2、核心代码模块导入

①提前导入相关内容，并且注册字体。（注册字体前需要先准备好字体文件）

②注册字体

③生成报告

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

用Python自动生成 图文并茂的数据分析 报告

1、一行命令，安装这个库

2、核心代码模块导入

①提前导入相关内容，并且注册字体。（注册字体前需要先准备好字体文件）

②注册字体

③生成报告

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

用Python自动生成图文并茂的数据分析报告