[R数据科学] 1.6几何对象

简介: 前面几节的内容比较少,第1.5节我对其做了补充,可见R可视乎|分面一页多图,课后练习题也可在该篇文章中找到。

前言


本最近打算把《R数据科学》过一遍,并且把课后习题都做一下。先从第一章开始吧,快速把ggplot过一下。第一章目录如下:

ZQJ@_%{Q3I0Y2IODESU1X9I.png

前面几节的内容比较少,第1.5节我对其做了补充,可见R可视乎|分面一页多图,课后练习题也可在该篇文章中找到。


1.6节主要讲几何对象:表示数据的几何图形对象,比如条形图,折线图,箱线图等。要想改变图中的几何对象,需要修改添加在ggplot() 函数中的几何对象函数。1.6节的内容不是很多,我们主要通过写本节的练习来回顾知识点。


练习


(1) 在绘制折线图、箱线图、直方图和分区图时,应该分别使用哪种几何对象?

:geom_line(),   geom_boxplot(),  geom_histogram(),


(2) 在脑海中运行以下代码,并预测会有何种输出。接着在 R 中运行代码,并检查你的预测是否正确。

ggplot(data = mpg,
  mapping = aes(x = displ, y = hwy, color = drv)) +
  geom_point() +
  geom_smooth(se = FALSE)

想象下:x轴是displ,y轴是hwy,颜色使用drv填充,然后加了一个散点图(中间没有参数,用默认),再加上一个拟合曲线,没有绘制出区间。由于两个集合对象都没有对mapping进行设置,所以会使用原始涂层的aes(x = displ, y = hwy, color = drv))。所以出来的结果,散点图和拟合曲线都是三种颜色。下面是出来的颜色:

6}2_2]V{%_TYH34B_QE94)W.png


(3)  show.legend = FALSE 的作用是什么?删除它会发生什么情况?

:是把图例隐藏了,默认参数是show.legend = TRUE.


(4)  geom_smooth() 函数中的 se 参数的作用是什么?

:可以绘制出区间,当se = TRUE(默认)则会出现区间。


(5) 以下代码生成的两张图有什么区别吗?为什么?

#第一幅图
ggplot(data = mpg, mapping = aes(x = displ, y = hwy)) +
geom_point() +
geom_smooth()
#第二幅图
ggplot() +
geom_point(data = mpg,
mapping = aes(x = displ, y = hwy)
) +
geom_smooth(data = mpg,
mapping = aes(x = displ, y = hwy)
)

没有什么区别,第一个图在原始上就设定了x,y。后面两个集合对象就可以默认使用前面的设置了。而第二个图则是原始没有设置,而是在集合对象中一一设置了。

第一种方法:简便;第二种方法:灵活,可以设置不同的x,y。


(6) 自己编写 R 代码来生成以下各图image.gif

第一个图: x为displ,y为hwy。画了散点图(geom_point)并绘制了拟合曲线(geom_smooth),没加置信区间(se =FALSE)

ggplot(data = mpg,aes(x = displ,y = hwy))+
  geom_point(size=3)+
  geom_smooth(se=F,size=2)

(O7@6L@BI3W5O%HF_PC{ASC.png


第二个图: 在第一个基础上根据drv变量绘制了三条拟合曲线,并且没有绘制区间。并且把图例删除了(show.legend = FALSE)

ggplot(data = mpg,aes(x = displ,y = hwy))+
  geom_point(size=3)+
  geom_smooth(aes(fill=drv),se=F,size=2,show.legend = FALSE)

image.gif

第三个图: 散点图颜色的颜色根据drv变量进行变化,并且拟合曲线也是和散点图相同颜色(所以可以在最原始图层中加入color=drv),没有拟合曲线的区间,但是有图例(默认就是有的)。

ggplot(data = mpg,aes(x = displ,y = hwy,color=drv))+
  geom_point(size=3)+
  geom_smooth(se=F,size=2)

$249[LP57}O`HJOM0KZB}ZI.png


第四个图: 根据frv变量给散点图填充,但是只绘制了一条拟合线。所以这里不可以直接放在原始图层里,得放在geom_point()中。

ggplot(data = mpg,aes(x = displ,y = hwy))+
  geom_point(aes(color=drv),size=3)+
  geom_smooth(se=F,size=2)

83@F0%@O_~KKPFT6R)VDU_O.png


第五幅图:在第三幅图基础上改变了拟合曲线的线的类型(linetype)。

ggplot(data = mpg,aes(x = displ,y = hwy,color=drv))+
  geom_point(size=3)+
  geom_smooth(aes(linetype=drv),se=F,size=2)

image.gif

第六幅图: 没有拟合曲线,直接将散点图的颜色区分开了,有点像第三幅图的简化版。

ggplot(data = mpg,aes(x = displ,y = hwy,color=drv))+
  geom_point(size=3)

30(KHJM0(E}HZG6)G55U4DB.png

目录
相关文章
|
10月前
|
机器学习/深度学习 数据可视化 数据挖掘
数据分享|R语言对论文作者研究机构、知识单元地理空间数据可视化
数据分享|R语言对论文作者研究机构、知识单元地理空间数据可视化
|
10月前
|
机器学习/深度学习 自然语言处理 数据可视化
【Python百宝箱】数据科学的黄金三角:数据挖掘和聚类
【Python百宝箱】数据科学的黄金三角:数据挖掘和聚类
251 2
|
Python
【数据科学导论】实验一:语法、变量和数据类型
【数据科学导论】实验一:语法、变量和数据类型
136 0
|
数据建模 数据挖掘 Linux
|
存储 NoSQL
《R语言编程艺术》——3.1 创建矩阵
本节书摘来自华章计算机《R语言编程艺术》一书中的第3章,第3.1节,作者:(美)麦特洛夫(Matloff,N.)著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1295 0