flask + pyecharts 搭建新冠肺炎疫情数据可视化交互分析平台:包含疫情数据获取、态势感知、预测分析、舆情监测等任务

本文涉及的产品
Web应用防火墙 3.0,每月20元额度 3个月
云安全中心免费试用套餐资源包,价值199.45元额度,3个月
云安全中心 免费版,不限时长
简介:

该项目是浙江大学地理空间数据库课程作业8:空间分析中,使用 flask + pyecharts 搭建的简单新冠肺炎疫情数据可视化交互分析平台,包含疫情数据获取、态势感知、预测分析、舆情监测等任务

包含完整代码和实现的github地址:
https://github.com/yunwei37/COVID-19-NLP-vis

项目分析报告已部署到网页端,可点击http://flask.yunwei123.tech/进行查看

交互可视化分析截图:

line

ana

wordcloud

weibos

空间数据分析 作业要求

作业目的:

了解空间数据在日常生活中的应用,熟悉空间数据统计分析、空间数据挖掘、空间数据可视化等技术。

作业内容:

新型冠状病毒肺炎(COVID-19,简称“新冠肺炎”)疫情肆虐全球多个国家,2020年3月11日,世界卫生组织 (WHO) 正式宣布将新冠肺炎列为全球性大流行病。在全球抗击新型冠状病毒疫情的过程中,产生了前所未有的大规模疫情数据,利用大数据分析技术和方法能够协助发现病毒传染源、监测疫情发展、调配救援物资,从而更好地进行疫情防控工作。空间数据分析作为大数据分析的重要组成,将数据智能处理、直观展示和交互分析有机地结合,使机器智能和人类智慧深度融合、优势互补,为疫情防控中的分析、指挥和决策提供有效依据和指南。

作业要求以新冠疫情或其它重大公共卫生事件的相关时空数据为基础,利用数据清洗与管理、统计分析、数据挖掘、数据可视化等相关技术和方法,探索并发现疫情大数据背后隐藏的模式和规律。请选择一个具体的研究题目,进行深入分析。

选题:疫情预测与舆情监测:

本项目希望能利用交互式空间数据分析技术,感知和预测疫情发展趋势与关键节点、分析社交媒体话题与情感的动态演变、对社会舆情进行态势感知。

文档与目录结构

  • dataSets:使用的数据集

    • china_provincedata.csv 中国各省、直辖市、自治区、特别行政区的疫情数据
    • countrydata.csv 全球214个国家地区以及钻石公主号邮轮的疫情数据
    • nCoV_900k_train.unlabled.csv

      数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)。

    • nCoV_100k_train.labled.csv 同上,有标注

      数据集太大了就先不上传了

    • nCov_10k_test.csv 同上

    • yqkx_data-5_21.csv 使用爬虫获取的人民网疫情快讯新闻100篇
    • 中国社会组织_疫情防控-5_21.csv 中国社会组织公共服务平台疫情防控专区新闻
    • weiboComments-5_21.csv 5.21微博《战疫情》主题下的微博和评论数据
  • notebook 分析时使用的notebook
  • scripts python脚本(爬虫、可视化、数据处理等等)
    • spider-yqkx.py 人民网爬虫
    • spider-社会组织.py 中国社会组织公共服务平台爬虫
    • weibo_战疫情爬虫_spider.py 微博《战疫情》爬虫
    • pyecharts-zhexian-country.py 使用pyecharts绘制任一国家疫情数据曲线图
    • hierachy.py 层次聚类分析代码
    • jiebafenci.py jieba分词代码及词云图渲染
    • lineCountry.py 生成疫情曲线图
    • logistic.py logistic分析代码
    • mapchina.py 生成中国疫情地图
    • mapworld.py 生成世界疫情地图
    • mergeweibo.py weiboprocess.py 微博数据处理工具
    • weiboAnalyse.py 微博数据分析代码
    • wordData.py weiboWordData.py 词云图保存数据
    • tfidf.py tfidf值可视化
    • sentiments.py 情感分析
  • templates: 网站html/css/js及图片文件

作业部分相关技术栈

  • 数据库的构建与sql语句查询
  • pyEcharts可视化
  • postgres sql数据分析
  • snownlp 情感分析
  • jieba
  • flask
目录
相关文章
|
机器学习/深度学习 数据采集 自然语言处理
岭回归与LASSO回归:解析两大经典线性回归方法
岭回归与LASSO回归:解析两大经典线性回归方法
岭回归与LASSO回归:解析两大经典线性回归方法
|
数据采集 JavaScript 数据安全/隐私保护
「Python」爬虫实战-北京公交线路信息爬取(requests+bs4)
使用requests爬取北京公交线路信息,目标网址为[https://beijing.8684.cn/](https://beijing.8684.cn/)。 爬取的具体信息为公交线路名称、公交的运营范围、运行时间、参考票价、公交所属的公司以及服务热线、公交来回线路的途径站点。
2765 0
|
数据处理
软件工程——需求分析(生存周期),需求规格说明书,数据流图
在前面我们进行了项目的软件计划,完成了可行性研究报告,知道了要做什么的问题,而下一步,我们就需要进一步的了解项目具体要怎么做,回答必须要做什么的问题了。
|
10月前
|
数据可视化 数据挖掘 定位技术
Python和Geopandas进行地理数据可视化
【10月更文挑战第22天】本文介绍了如何使用Python和Geopandas进行地理数据可视化和分析,涵盖从准备工作、加载数据、数据探索与处理、地理数据可视化、空间分析与查询到交互式地理数据可视化等内容。通过丰富的代码示例和案例演示,帮助读者掌握地理数据分析的基本方法,为实际应用提供支持。
608 19
|
数据采集 自然语言处理 监控
【优秀python毕设案例】基于python django的新媒体网络舆情数据爬取与分析
本文介绍了一个基于Python Django框架开发的新媒体网络舆情数据爬取与分析系统,该系统利用Scrapy框架抓取微博热搜数据,通过SnowNLP进行情感分析,jieba库进行中文分词处理,并以图表和词云图等形式进行数据可视化展示,以实现对微博热点话题的舆情监控和分析。
979 110
【优秀python毕设案例】基于python django的新媒体网络舆情数据爬取与分析
|
10月前
|
数据采集 机器学习/深度学习 搜索推荐
大数据与社交媒体:用户行为分析
【10月更文挑战第31天】在数字化时代,社交媒体成为人们生活的重要部分,大数据技术的发展使其用户行为分析成为企业理解用户需求、优化产品设计和提升用户体验的关键手段。本文探讨了大数据在社交媒体用户行为分析中的应用,包括用户画像构建、情感分析、行为路径分析和社交网络分析,以及面临的挑战与机遇。
|
11月前
|
容灾 Cloud Native 关系型数据库
实现MySQL异地多活场景
现代化互联网企业面临的最大威胁是意外导致的数据丢失或不可用。为应对这一挑战,企业通常采用“主从高可用”架构,但单一机房内的高可用仍存风险。真正的高可用需通过“跨机房容灾”或“异地容灾”实现。异地容灾将服务器部署在不同地域的机房中,确保一处受灾时,其他机房能迅速接管业务。更进一步的“异地多活”方案则让各节点同步处理业务流量,确保数据一致性,提高资源利用率。NineData 提供了实现这一方案的强大工具。
387 0
|
数据可视化 Python
使用Python进行数据可视化:从入门到精通
【8月更文挑战第60天】本文是一篇面向初学者的Python数据可视化教程,旨在帮助读者掌握如何使用Python及其强大的库(如Matplotlib和Seaborn)来创建引人入胜的数据可视化。我们将从基础开始,逐步深入,最终达到能够独立完成复杂数据可视化项目的水平。无论你的背景如何,只要你对数据可视化感兴趣,这篇文章都将为你开启一段新的学习之旅。
|
监控 前端开发 JavaScript