该点子来源于一个小作业,作业要求是使用R平台相关绘图工具绘制中国疫情热力图(10分),参考效果如下图:
第一次使用R绘制地图的我,一脸懵逼。于是我开始翻书(《R语言数据可视化之美》,《ggplot2》),《R数据科学》),以及百度搜索。找到了几篇很实在的blog(见文末)。最后我的作业如下:
所需的包
library(mapdata)library(maptools)library(ggplot2)library(plyr)
利用maptools包,可以导入shp格式的中国地图(相当于一个模板),该文件可通过网上获取,为了大家方便实战,我i已经将该文件放在我的github里,尽情下载。
china_map = readShapePoly("bou2_4p.shp")#导入shp格式的中国地图x<-china_map@data
得到的中国地图数据如下
地图中共计有925个地域信息,并将其转化为数据库,并基于id进行连接。
xs<-data.frame(x,id=seq(0:924)-1)china_map1<-fortify(china_map) #转化为数据框china_map_data<-join(china_map1,xs,type="full")#基于id进行连接a = data.frame(unique(china_map@data$NAME))#省份名称
接下来准备我们的数据,数据主要来自丁香园,是某一天的中国各省数据(ratio表示累计确认人数,people表示当天确认人数,province表示省份)一共31的省份,包括(香港,台湾)。基于两个表格相同属性(NAME)进行合并,这样就可以把模板中的地理信息一起合在一起了,这是关键步骤。
mydata<-read.csv("data_dt.csv",header=T,as.is=T)china_data <- join(china_map_data, mydata, type="full")#基于NAME字段进行连接,NAME字段来自于地图文件中
绘制地图:
版本一(无省份名称的当日各省确认人数)
ggplot(china_data, aes(x = long, y = lat, group = group, fill = people)) + geom_polygon(colour="grey40") + scale_fill_gradient(low="white",high="steelblue") +#指定渐变填充色,可使用RGB theme( #清除不需要的元素 panel.grid = element_blank(), panel.background = element_blank(), axis.text = element_blank(), axis.ticks = element_blank(), axis.title = element_blank(), legend.position = c(0.2,0.3) )
版本二(有省份名称的当日各省确认人数)
midpos <- function(x) mean(range(x,na.rm=TRUE)) #取形状内的平均坐标centres <- ddply(china_data,.(NAME),colwise(midpos,.(long,lat))) ggplot(china_data,aes(long,lat))+ geom_polygon(aes(group=group,fill=people),colour="black")+ scale_fill_gradient(low="white",high="steelblue") + geom_text(aes(label=NAME),data=centres) + theme( panel.grid = element_blank(), panel.background = element_blank(), axis.text = element_blank(), axis.ticks = element_blank(), axis.title = element_blank() )
当然如需绘制当日累计各省确诊人数,只需将fill=people换成fill=ratio即可,大家可以自己尝试。代码,数据相关资料与shp格式的中国地图都已放在我的github上了。https://github.com/liangliangzhuang/R_example