电影是每个人生活中必不可少的娱乐方式,随着文化事业的发展,我们往往会接触到很多不同国家与不同种类的电影,而在评判一部电影好坏的过程中,需要通过获取得到电影相关的数据。从各个维度去评判电影的质量。从电影在全球的发行量,不同类型的电影在全球的流行度等方向进行深入研究。但由于文化背景不同,不同国家网民对电影的评判存在一定的差异,这就需要我们通过对数据进行处理选取合适的字段对数据进行可视化操作,再从数据与图表的结果中进行综合的分析得出我们想要的结果
部分电影的数据格式:
国家 | 流行度 | 收益额 | 影评数 | |
0 | Afghanistan | 1.447734 | 0 | 32 |
1 | Argentina | 46.588366 | 64031879 | 668 |
2 | Aruba | 2.706207 | 0 | 64 |
3 | Australia | 2119.245885 | 7317847590 | 62551 |
4 | Austria | 71.293755 | 105655187 | 2541 |
5 | Bahamas | 31.036000 | 141195658 | 562 |
6 | Belgium | 178.270760 | 245386359 | 3403 |
7 | Bhutan | 0.749699 | 0 | 9 |
8 | Bolivia | 5.223096 | 623528 | 73 |
9 | Bosnia and Herzegovina | 8.048305 | 0 | 96 |
10 | Brazil | 133.437236 | 181908563 | 3628 |
11 | Bulgaria | 78.370037 | 216256385 | 1867 |
12 | Canada | 4228.031666 | 11833327293 | 120441 |
13 | China | 791.688178 | 4411910759 | 33804 |
可视化:
dict_data为上部分数据的变量,为DataFrame格式
frompyechartsimportoptionsasoptsfrompyecharts.chartsimportMapfrompyecharts.fakerimportFakerworld= ( Map() .add("流行量", [list(z) forzinzip(list(dict_data.国家), list(dict_data.流行度))], "world") .add("收益额", [list(z1) forz1inzip(list(dict_data.国家), list(dict_data.收益额))], "world") .add("影评数", [list(z2) forz2inzip(list(dict_data.国家), list(dict_data.影评数))], "world") .set_series_opts(label_opts=opts.LabelOpts(is_show=False)) .set_global_opts( title_opts=opts.TitleOpts(title="全球电影数据分布"), visualmap_opts=opts.VisualMapOpts(), ) # .render("map_world.html")) world.render_notebook()
可视化结果图: