<自动化办公> 两秒完成250页豆瓣电影PPT

简介: PPT并不好用, 但还是得用它, 这里借用豆瓣Top250的电影信息, 利用python-pptx (0.6.7)自动生成250张PPT, 希望通过实例, 给常年整理PPT报表的上班族, 一个解放生产力的新思路Python 自动生成 豆瓣...

PPT并不好用, 但还是得用它, 这里借用豆瓣Top250的电影信息, 利用python-pptx (0.6.7)自动生成250张PPT, 希望通过实例, 给常年整理PPT报表的上班族, 一个解放生产力的新思路

Python 自动生成 豆瓣电影PPT

最终效果展示

PPT动图

数据哪里来的?

爬虫抓的!

不懂爬虫怎么办?

看这里《进击的虫师》爬取豆瓣电影海报(Top250)

自动化制作PPT 的 一二三

先制作PPT模板

插入占位符

占位符种类

制作模板的过程, 就是插入占位符的过程, 可以根据自己的需求插入各种占位符, 比如,豆瓣电影Top250的需求是, 插入图片和文本内容, 那就从占位符中选择, 内容, 图片, 插入模板就好, 然后再对模板中的内容样式和图片位置进行调整, 就能得到符合需求的模板了

模板长这样

准备数据:

我直接把原来写过的,python爬取豆瓣电影的脚本, 运行了一遍, 图片和文本数据就都齐了《进击的虫师》爬取豆瓣电影海报(Top250)

准备资源

Python编程(将数据按照模板填空, 导出到最终的ppt中)

源码如下(注释详尽):

from pptx import Presentation
from pptx.util import Inches

# 获取豆瓣电影信息
def getInfo():
    movies_info = []

    with open('./douban_movie_top250.txt') as f:
        for line in f.readlines():
            line_list = line.split("\'")
            one_movie_info = {}
            one_movie_info['index'] = line_list[1]
            one_movie_info['title'] = line_list[3]
            one_movie_info['score'] = line_list[5]

            try:
                one_movie_info['desc'] = line_list[7]
            except:
                one_movie_info['desc'] = ''

            one_movie_info['image_path'] = "./Top250_movie_images/"+ str(line_list[1]) + '_' + line_list[3] + ".jpg"

            movies_info.append(one_movie_info)

    return movies_info


# 创建ppt
def createPpt(movies_info):
    prs = Presentation('model.pptx')
    for movie_info in movies_info:
        # 获取模板个数
        templateStyleNum = len(prs.slide_layouts)
        # 按照第一个模板创建 一张幻灯片
        oneSlide = prs.slides.add_slide(prs.slide_layouts[0])
        # 获取模板可填充的所有位置
        body_shapes = oneSlide.shapes.placeholders
        for index, body_shape in enumerate(body_shapes):
            if index == 0:
                body_shape.text = movie_info['index']+movie_info['title']
            elif index == 1:
                img_path = movie_info['image_path']
                body_shape.insert_picture(img_path)
            elif index == 2:
                body_shape.text = movie_info['desc']
            elif index == 3:
                body_shape.text = movie_info['score']
    # 对ppt的修改  
    prs.save('豆瓣Top250推荐.pptx')


def main():
    # 获取豆瓣电影信息
    movies_info = getInfo()
    createPpt(movies_info)

if __name__ == '__main__':
    main()

Python生成图表(豆瓣电影Top20的评分为例)

Top20报表
# encoding: utf-8
from pptx import Presentation
from pptx.chart.data import ChartData
from pptx.enum.chart import XL_CHART_TYPE
from pptx.util import Inches

# 创建幻灯片
prs = Presentation()
slide = prs.slides.add_slide(prs.slide_layouts[6])

# 定义图表数据
chart_data = ChartData()
chart_data.categories = ['肖申克的救赎', '霸王别姬', '这个杀手不太冷', '阿甘正传', '美丽人生', '千与千寻', '泰坦尼克号', '辛德勒的名单', '盗梦空间', '机器人总动员', '海上钢琴师', '三傻大闹宝莱坞', '忠犬八公的故事', '放牛班的春天', '大话西游之大圣娶亲', '楚门的世界', '教父', '龙猫', '熔炉', '乱世佳人']
chart_data.add_series('豆瓣电影', (9.6, 9.5, 9.4, 9.4, 9.5, 9.2, 9.2, 9.4, 9.3, 9.3, 9.2, 9.2, 9.2, 9.2, 9.2, 9.1, 9.2, 9.1, 9.2, 9.2))
# 将图表添加到幻灯片
x, y, cx, cy = Inches(0), Inches(0), Inches(10), Inches(8)
slide.shapes.add_chart(XL_CHART_TYPE.COLUMN_CLUSTERED, x, y, cx, cy, chart_data)
prs.save('豆瓣 Top20 评分图.pptx')

关于数据图形化: Python有很多优秀的图形库, 比如matplotlab, 以及Google推出的在线编程工具colabratory, 都可以方便的实现数据可视化, 掌握了Python图形库的使用, 基本可以和PPT图表说拜拜了...


colabratory

教程涉及到的资源我都通过百度网盘分享给大家,为了便于大家的下载,资源整合到了一张独立的帖子里,链接如下:
http://www.jianshu.com/p/4f28e1ae08b1

目录
相关文章
|
4天前
|
数据采集 JSON JavaScript
Python爬虫案例:抓取猫眼电影排行榜
python爬取猫眼电影排行榜数据分析,实战。(正则表达式,xpath,beautifulsoup)【2月更文挑战第11天】
83 2
Python爬虫案例:抓取猫眼电影排行榜
|
7月前
用ChatGPT制作ppt
用ChatGPT制作ppt
66 0
|
10月前
|
数据采集 缓存 NoSQL
owllook在线小说搜索引擎使用指南
owllook是一个在线小说搜索引擎,其目的是让阅读更简单、优雅,让每位读者都有舒适的阅读体验
|
11月前
|
Java Spring
ChatGPT + MindShow 制作PPT
ChatGPT + MindShow 制作PPT
186 0
|
数据采集 Python
python爬虫爬取豆瓣电影排行榜
爬虫爬取豆瓣电影排行榜
180 0
|
数据挖掘 Python
Python数据分析系列03-豆瓣电影T250分析
很多人在羡慕别人身材好的时候,却不知道别人有多自律,然而,自己明明前一刻再提醒自己,一定要努力锻炼出好的身材,但是下一秒却没有办法控制自己的食欲。 总感觉自己有很多的才华,却没有机会去施展,可是却没有发现自己没有去努力的表现自己。
Python数据分析系列03-豆瓣电影T250分析
|
数据挖掘 Python
Python数据分析系列04-豆瓣影评、歌词词云分析
哈佛大学的校训之一:你所浪费的今天,是逝去的人所奢望的明天;你所厌恶的现在,是未来的你回不去的曾经。
Python数据分析系列04-豆瓣影评、歌词词云分析
|
JSON 数据可视化 API
粉丝让我爬取热搜话题,结果做成了实时热搜『跑马灯』可视化
之前有粉丝让我爬取网上热搜话题,根据粉丝的这个提议,我想到了爬取不同平台的热搜话题并做成了一个:**全网实时热搜话题『****跑马灯****』可视化**。 特点:**实时**、**可视化浏览** 这里的热搜数据来源主要是:**微博**和**知乎**,选择这两个平台的目的:1.用户流量大、2.直接的热搜数据Api接口。
219 0
粉丝让我爬取热搜话题,结果做成了实时热搜『跑马灯』可视化
|
Web App开发 存储 数据采集
Python爬虫入门教程 15-100 石家庄政民互动数据爬取
1. 石家庄政民互动数据爬取-写在前面 今天,咱抓取一个网站,这个网站呢,涉及的内容就是 网友留言和回复,特别简单,但是网站是gov的。网址为http://www.sjz.gov.cn/col/1490066682000/index.html 首先声明,为了学习,绝无恶意抓取信息,不管你信不信,数据我没有长期存储,预计存储到重装操作系统就删除。
2361 0
手把手教你做一个电影网站 可直接在线播放
现在大家在网上看电影很方便了,因为电影网站多如牛毛!那很多人在想,做电影网站难么?能否拥有一个属于自己的电影网站呢?其实真的可以,而且很简单下面我们就来手把手的教你如何做一个电影网站!因为我的空间是PHP的,只能选择PHP CMS,影视网站的CMS有很多,飞飞、苹果、海洋、PHPVOD等等,之所以...
14415 0