数据新闻大赛

简介: 数据新闻大赛

注:

由于网页基调为深蓝色,因此HTML格式图片背景色均为深蓝#323a5e。

原代码我找找,过两天放上来

分布地图

院士家乡图

先爬取科学院院士官网,通过正则法则的分词处理每位院士的介绍,将所有科学院院士名单爬下来。

然后对名单所在的家乡地进行count统计。

最后调用pyercharts,绘制Html网页版的院士家乡个数分布图。

本科院校分布图

词云图

爬取微博https://m.weibo.cn/2656274875/4687873717044893网页成txt文本,对关键词进行提取,然后对需要的部分进行分词。

最后选择一张分届明显、形状分明的图片,生成词云图。

拖拉交互柱形图

每个省份的本科院校数

单轴气泡图

各国教育投入经费

爬取网页后,对数据进行excel处理后,生成单轴气泡图。

饼图

2019年世界各国经费分布饼图

简化版

使用 PyEcharts 绘制院士家乡个数分布图的 HTML 网页版

在数据可视化领域,PyEcharts 是 Python 中一个强大的工具,它基于 ECharts 库,可以帮助你轻松地创建各种交互式图表和可视化效果。在本篇博客中,我们将学习如何使用 PyEcharts 绘制院士家乡个数分布图的 HTML 网页版,以便更清晰地展示数据。

准备工作

在开始之前,你需要确保已经安装了 PyEcharts 库和相关依赖。你可以使用 pip 安装 PyEcharts:

pip install pyecharts

接下来,我们将从头开始创建一个院士家乡个数分布图的 HTML 网页版。

数据准备

为了创建家乡分布图,首先需要准备数据。假设我们有一组院士数据,其中包含了每位院士的家乡信息,我们想要统计不同家乡的院士数量。

让我们假设数据如下:

data = {
    '湖南': 10,
    '广东': 15,
    '浙江': 8,
    '江苏': 12,
    # 其他省份数据...
}

创建分布图

接下来,我们将使用 PyEcharts 来创建家乡分布图。首先,导入必要的模块:

from pyecharts import options as opts
from pyecharts.charts import Map

然后,使用以下代码创建分布图:

c = (
    Map()
    .add(
        series_name="院士数量",
        data_pair=data.items(),
        maptype="china",
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title="院士家乡分布图"),
        visualmap_opts=opts.VisualMapOpts(
            is_piecewise=True,
            pieces=[
                {"value": 0, "label": "0"},
                {"min": 1, "max": 10, "label": "1-10"},
                {"min": 11, "max": 20, "label": "11-20"},
                {"min": 21, "label": "21+"},
            ],
            in_range={"color": ['#e0ffff', '#006edd']},
        ),
    )
)
c.render("academicians_hometown.html")

这段代码做了以下事情:

  • 创建一个 Map 实例。
  • 使用 .add() 方法添加数据,其中 data_pair 参数包含家乡和院士数量的数据。
  • 设置全局选项,包括标题、颜色映射等。
  • 最后,使用 .render() 方法将图表保存为 HTML 文件。

查看结果

运行上述代码后,将生成一个名为 “academicians_hometown.html” 的 HTML 文件。你可以通过浏览器打开它,查看生成的家乡分布图。

总结

使用 PyEcharts 绘制院士家乡个数分布图是一项相对简单的任务,但可以极大地增强数据可视化的效果。你可以根据自己的数据和需求来自定义图表样式和标签,以便更好地传达信息。希望本篇博客能帮助你开始使用 PyEcharts 创建交互式分布图和其他类型的数据可视化。

词云图

创建词云图是一种独特而有趣的数据可视化方式,可以帮助你直观地展示文本数据中的关键词。在本篇博客中,我们将学习如何使用Python中的WordCloud库来创建词云图。

准备工作

在开始之前,你需要安装WordCloud库。你可以使用pip进行安装:

pip install wordcloud

数据准备

首先,你需要准备包含文本数据的文件或字符串。在这个示例中,我们将使用一个简单的文本字符串作为示例:

text = "Python is an amazing programming language and it is widely used for data analysis, machine learning, and web development. Data visualization is an important part of data analysis, and word clouds are a popular way to visualize key terms in a text document."

创建词云图

接下来,我们将使用WordCloud库来创建词云图。导入必要的库和模块:

from wordcloud import WordCloud
import matplotlib.pyplot as plt

然后,使用以下代码来生成和显示词云图:

# 创建词云对象
wordcloud = WordCloud(width=800, height=400, background_color='white').generate(text)
# 显示词云图
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()

这段代码做了以下事情:

  • 创建一个WordCloud对象,可以设置词云图的宽度、高度和背景颜色等选项。
  • 使用generate()方法生成词云图。
  • 使用matplotlib库来显示词云图。

运行这段代码后,将显示一个词云图,其中包含了输入文本中的关键词,并且词语的大小表示其在文本中的重要性。

词云图的进一步定制

你可以根据自己的需求定制词云图,包括颜色、字体、形状等。例如,你可以指定词云图的形状,让词云中的词汇填充到特定形状中。

保存词云图

如果你想保存词云图为图像文件,可以使用WordCloud库的to_file()方法:

wordcloud.to_file("wordcloud.png")

这将把词云图保存为名为 “wordcloud.png” 的图像文件。

结语

创建词云图是一种有趣的数据可视化方法,它可以帮助你更好地理解文本数据的关键主题和关键词。你可以根据自己的需求定制词云图的外观和样式,以满足特定的可视化需求。希望本篇博客对你有所帮助,让你开始使用WordCloud库创建词云图。

目录
相关文章
|
消息中间件 人工智能 Kubernetes
共建共享数字世界的根:阿里云打造全面的云原生开源生态
目前,阿里云开源主要涵盖云原生、操作系统、大数据&AI、数据库四大领域,在 GitHub 上收获 Star 总数超百万,阿里已经连续十年蝉联中国厂商开源活跃度、影响力第一。
共建共享数字世界的根:阿里云打造全面的云原生开源生态
|
小程序
看图猜成语微信小程序源码
后台可以自行设置关卡、等级、也可以一键部署, 开通流量主之后实现躺赚,你懂得。 个人号也可以开通,审核一次性必过。 类目选择 教育,源码仅供您参考!
238 2
|
7月前
|
数据采集 XML JavaScript
Python爬虫:从人民网提取视频链接的完整指南
Python爬虫:从人民网提取视频链接的完整指南
|
11月前
|
数据采集 前端开发 JavaScript
动态与静态网站抓取的区别:从抓取策略到性能优化
本文详细介绍了动态与静态网站抓取的区别、抓取策略及性能优化技巧,并提供了相关代码示例。静态网站抓取通过简单的HTTP请求和解析库实现,而动态网站则需使用Selenium等工具模拟浏览器执行JavaScript。文章还展示了如何使用代理IP、多线程和合理的请求头设置来提高抓取效率。
461 2
动态与静态网站抓取的区别:从抓取策略到性能优化
|
11月前
|
搜索推荐 数据挖掘 API
探讨京东商品 API 接口:运用及收益
在数字化商业时代,京东商品 API 接口为企业和开发者提供了丰富的数据资源和应用机会。通过获取商品信息、价格、库存、用户评价等数据,API 接口助力电商平台建设、数据分析、移动应用开发和营销推广,提升商业价值、优化用户体验,并支持战略决策。遵守规范、保障数据安全是实现长期发展的关键。
266 2
|
SQL Java 数据库连接
【MyBatis-Plus】快速精通Mybatis-plus框架—快速入门
【MyBatis-Plus】快速精通Mybatis-plus框架—快速入门
619 0
|
存储 消息中间件 Kubernetes
10分钟在 Rainbond 上部署 mall 电商项目
本文介绍在 Rainbond 上的两种部署 mall 电商项目的方式: 1. 通过 Rainbond 开源应用商店快速部署 mall 2. 从 0 开始部署 mall 项目所有服务
|
物联网 5G 智能硬件
【专栏】无线通信的基础术语,如频段、带宽、调制与解调,以及Wi-Fi、蓝牙、ZigBee等无线技术
【4月更文挑战第28天】本文介绍了无线通信的基础术语,如频段、带宽、调制与解调,以及Wi-Fi、蓝牙、ZigBee等无线技术。还涉及无线信号传播、信道容量、信噪比等概念。理解这些术语有助于深入理解无线通信原理,便于设计和优化无线系统。随着无线技术的不断发展,持续学习是关键。开始你的无线通信探索之旅吧!
800 0
|
弹性计算 Windows
在ECS上使用Windows “跨区卷”、“条带卷”讨论以及扩容操作
针对Windows动态磁盘的特殊使用场景,进行了一些讨论和实践。 结论,不推荐使用非“简单卷”形式的动态磁盘
3512 0
|
定位技术
ArcGIS产生随机样本点的方法
本文介绍基于ArcMap软件,实现在指定区域自动生成随机点的方法~
686 1
ArcGIS产生随机样本点的方法