能力说明:
了解Python语言的基本特性、编程环境的搭建、语法基础、算法基础等,了解Python的基本数据结构,对Python的网络编程与Web开发技术具备初步的知识,了解常用开发框架的基本特性,以及Python爬虫的基础知识。
暂时未有相关云产品技术能力~
公众号《庄闪闪的R语言手册》
在本章中,我们将介绍基于 flexdashboard[1] 包的仪表盘。 仪表盘在业务风格的报告中特别常见。它们可以用来突出报告的概要和关键内容。仪表盘的布局通常是基于网格搭建的,各个组件排列在各种大小的“盒子”中。
上一期已经对使用 latex 模板构建 cv 做了较为详细的说明:R沟通|使用latex模板构建个人履历。但是存在一个问题:Latex 最后输出的是 pdf 版本,如果你想把他部署到自己的个人网站上,可能就比较费劲了(害,是我不会)。所以请教了李康国学弟之后,我又尝试了下使用 Rmarkdown 构建 cv 并将其部署到 gitee中,这样所有人都可以通过网址访问我的 cv 了。
前几天由于个人需求,需要快速搭建一个英文履历表简历,一直没有头绪。找几个word简历模板做?排版太麻烦了,整个界面还挺不自然的。那试试latex模板吧,咨询了周师兄,给我推荐了下面网站: https://www.overleaf.com/latex/templates/tagged/cv
1.5w字的Rmarkdown入门教程汇总
1.5w字的Rmarkdown入门教程汇总
1.5w字的Rmarkdown入门教程汇总
四月开始啦!每个月开头都会逛一逛“统计之都[1]“,因为每月的统计月读[2]更新啦!三月的统计月读有一个内容真的让人心动,而且非常实用!推荐人是:孔令仁,网址链接为:https://www.connectedpapers.com/ 在此,小编尝试使用了这个网站,并且做了简单的教程分享给大家。
关于RMarkdown使用时,小编日常会使用的一些有用技巧,当然我也是通过学习谢大大的Rmarkdown-cookbook[1]以及日常使用需求上网搜的解决方案,在此分享给大家。如果大家还有其他什么需求,可以在留言板留言。或者有其他实用技巧也欢迎分享!
Rmarkdowm作为可复用报告的优秀工具,除了提供文档编辑、图表输出外,还有许多主题格式供使用者选择。除了默认的主题外,还可以通过加载rticles、prettydoc、rmdformats、tufte等包获取更多主题格式。下面我们看看几类扩展包里的主题样式。
如果你还在纠结:学数据科学到底用 python 还是 R 好?现在我的回答是:大可不必。现在两者的变量可以相互调用了。你可以用 R 做数据处理(tidyverse),可视化(ggplot2),用 python 做开发。具体可参考该文章:R Vs Python: What’s the Difference?[1]
最近有读者问我,如何查看R语言某包中某函数的源代码呢?我第一时间给出了自己比较常用的方法(见方法一),今天打算做个这方面的推文,于是又查了些资料,才发现原来水好深!还有更好的方法(见方法二),并且和不同的面向对象系统有关。
最近在学习过程中,发现了一本与空气质量数据分析有关的书,书名叫做《The openair book——Tools for air quality data analysis》,作者是:David C. Carslaw。值得一提的是,这本书是开源的,通过bookdown构建的,网址链接为:https://bookdown.org/david_carslaw/openair/。
这里小编给出一些常用的选项,文字版本较难理解的话,请配合我的b站视频教程[1]。
寒假期间花了大量时间(100h+)学习和制作了Rmarkdown入门教程,昨晚终于录制和剪辑完毕
借助theme()函数,可以自定义ggplot2图表的任何部分。幸运的是,可以使用大量的预构建主题,仅用一行代码即可获得良好的样式。 小编汇总了常用几个包的主题风格以供参考,以后可以根据论文的风格选择内置的一些主题。
假设你已经安装了R[1](R Core Team 2020)和RStudio IDE[2]。
以下快捷键为平时小编用的比较多的,以前总是记不住这些枯燥的快捷键,只好找小本本记下,想用的时候翻翻本子,用着用着就印在脑子里了。现在整理起来写篇推送还是非常有意义的,这次配上小视频(gif),以便大家记忆。星数(⭐)表示常用指数,满星3颗,星越多越需要记下使用噢!
在可靠性实验中,不同产品的测试失效时间可以通过克利夫兰点图进行可视化,今天就对该系列的图进行系统的介绍。主要参考张杰博士的《R语言数据可视化之美》[1],并结合我实际使用经验进行修改。
因子在 R 中用于处理分类变量。从历史上看,因子远比字符串更容易处理。因此,R 基础包中的很多函数都自动将字符串转换为因子。
知乎看到这样一个问题,不请自来回答一下,也算对这段时间可视化推文的一个总结吧。看到很多答主都给出了全面的回答,包括数据处理,统计建模等方面。而在这篇推文中,我将对自己较为擅长的领域(R语言可视化)进行详细的介绍。全文干货十足,给出的拓展链接也十分丰富。可以先收藏,以后慢慢研究。
本章通过学习字符串的处理,再结合正则表达式进行正确的模式匹配。
本章通过学习字符串的处理,再结合正则表达式进行正确的模式匹配。
主成分分析法是很常用的一种数据降维方法[1]。该方法可以减少数据的维数,并保持对方差贡献最大的特征,相当于保留低阶主成分,忽略高阶主成分。 关于主成分的理论介绍和R语言代码实现可见前段时间赵西西写的推文:主成分分析。但是后面留了一个小尾巴,如果想对主成分结果进行可视化,那得怎么实现?有没有简便的方法呢? 正好这几天有读者问起,那今天就来说说这个问题吧。
上一期我们讲解了如何使用谢益辉写的xaringan包[1]制作幻灯片,推文在这:R沟通|用xaringan包制作幻灯片。但是最后留了一个小尾巴,如果你不喜欢最原始版本的主题的话。你可以把内部的css进行设置,这时你得需要一些javascript的知识。
在实际应用中,我们常会涉及到多个数据表,必须综合使用它们才能找到关键信息。存在于多个表中的这种数据统称为关系数据。本章中的很多概念都和SQL中的相似,只是在dplyr中的表达形式略微不同。一般来说,dplyr 要比 SQL 更容易使用
这是我在数值模拟时,经常存在的问题。 如果输出了非常多的表格(例如,Rmse,Rb,Cp等),我应该怎么把这么多表进行导出?
谢益辉写的xaringan包[1],可以创建幻灯片。个人认为ppt的很多功能,它都能实现,接下来将通过几次推送对这个包(中文名:写轮眼)进行详细讲解。 官方教程说明[2]给出了一些基本教程,这里我对其进行介绍以及给出小编自己做的实例展示。
本文将介绍如何使用readr包将平面文件加载到 R 中,readr 也是 tidyverse 的核心 R包之一。
前段时间在做论文数值模拟的时候,得跑非常久的代码,一旦模拟次数增加就要等好几个小时。所以会另开界面做其他事情(写理论部分,看文献啥的)。但是看着看着,可能就忘记R还在跑的事了。等我想起来,代码早就跑好了😒。
通常而言,在绘制图形的时候都是绘制某一种类型的一张图形,例如绘制一张散点图,绘制直方图。但有的时候我们希望同时展示多幅图形,可能是因为这些图形有某种联系,需要共同展示才能够更好的表达数据中蕴含的信息。之前介绍的边际图形就是这样的一个例子。本章节会介绍,当我们绘制了好了多幅图形之后,如何将多幅图形合并起来。
平常在各种R语言群里,总会遇到关于安装R包的问题,例如:搭载在github上的R包,由于网速(外网)原因而无法下载该怎么办? 这里小编分享下平常逼不得已才使用的“下三滥”方法——直接下载包,通过本地安装。
R文档沟通前两期内容: R沟通|舍弃Latex,拥抱Rbeamer吧! R沟通|制作个性化ppt! 这期主要介绍下如何在Rstudio中运行和使用.tex文件,并给大家安利一个非常nice的模板和根据该模板制作的案例。 使用教程
代码太乱了,谁帮我整理下?最近学习王敏杰老师的《数据科学中的R语言》[1],学到了这么个好技巧,正好自己在整理论文中数据模拟的代码。借此机会,在这和大家分享下,也算记个笔记在公众号上。
tibble是一种简单数据框,它对data.frame的功能进行了一些修改,更易于使用。本文将介绍tidyverse的核心R包之一——tibble包
沟通文档系列第一期为:如何使用Rmarkdown制作Rbeamer。今天来介绍下另一种文档沟通形式:如何使用Rmarkdown制作私人定制版ppt!
研一讨论班的时候,得做学术ppt,得知得学习latex。整蛊了好久才把latex装好(texlive花了3个多G,期间各种踩坑)。如今了解到可以使用Rmarkdown构建beamer主题的slides(小编后知后觉了😭 )。
对于两个连续变量间的相关变动的可视化表示有一下两种方法: 1. 使用geom_point()画出散点图 2. 使用分箱处理
通过github获取大佬们开源项目的源代码和数据,并且理解大佬们便编写代码的技巧和思想,这是进阶R以及其他语言的最有效方法之一了。
跑程序时电脑突然崩溃,程序被强制中断导致代码不见了怎么办? 这些糟心的情况想必每个打工人都不想经历,偏偏我就是那个倒霉蛋,今早打开电脑发现昨晚写的代码忘记保存,心态崩到想当场飙眼泪,冷静下来之后开始寻找解决方案
要想对两个分类变量间的相关变动进行可视化表示,需要计算出每个变量组合中的观测数量。常用的两种方法有
ggvis[1]是R的一个数据可视化包,它可以: • 使用与ggplot2类似的语法描述数据图形; • 创建丰富的交互式图形,在本地Rstudio或浏览器中使用这些图形; • 利用shiny的基础结构发布交互式图形。
如果变动描述的是一个变量内部的行为,那么相关变动描述的就是多个变量之间的行为。相关变动是两个或多个变量以相关的方式共同变化所表现出的趋势。查看相关变动的最好 方式是将两个或多个变量间的关系以可视化的方式表现出来。如何进行这种可视化表示同 样取决于相关变量的类型。
5.1 习题解答
上次可视化系列说了瀑布图(可跳转)。它可以用于展示拥有相同的X轴变量数据(如相同的时间序列)、不同的Y轴离散型变量(如不同的类别变量)和Z轴数值变量。
R数据科学|5.4内容介绍及习题解答
最近学习可视化时发现了一个好用的包,可以直接使用“拖拽”的方式生成绘图,不需要写任何代码!这个包是esquisse,具体介绍可以见对应的github[1]。这是建立在ggplot2包[2]基础上设计的。你可以通过生成ggplot2图表以交互方式探索esquisse环境中的数据。入门门槛极低,有点类似tableau的感觉。
5.3.4 习题解答
2021年即将到来,小编学习了calendR这个包,并写了两篇推送。分别为: R可视乎|2021年日历大派送 calendR包—私人定制专属日历 并开源了自己的代码在github上,但是细心的读者发现代码还存在可以优化的地方。
前两天给大家派送了小编自己定制的2021年日历和月历,看到好多读者下载了,小编表示很欣慰😁。上期推送可见:R可视乎|2021年日历大派送 今天来说说这个包吧,非常简单,比起ggplot2包绘制日历要简单的多。
虽然与summarize()函数结合起来使用是最有效的,但分组也可以与mutate()和filter()函数结合,以完成非常便捷的操作。