能力说明:
了解Python语言的基本特性、编程环境的搭建、语法基础、算法基础等,了解Python的基本数据结构,对Python的网络编程与Web开发技术具备初步的知识,了解常用开发框架的基本特性,以及Python爬虫的基础知识。
暂时未有相关云产品技术能力~
公众号《庄闪闪的R语言手册》
在查阅文献的过程中,看到了几幅非常不错的出版图,今天就跟着小编一起学习下,他们是怎么使用 R 绘制出来的。
指标是数据分析的基础,搭建一个完善的指标体系能让分析工作变得更加高效,还能量化业务质量。在真实场景中,经常会遇到异常指标,清晰的指标体系能帮助我们快速定位问题。今天将系统地介绍一下指标体系的搭建和异常指标分析思路。
论文中需要绘制数据对于不同分布假定下的 QQ 图。这里小编主要是使用 qqplotr 包进行绘制,参考的博客:An Introduction to qqplotr[1]。
上期 基于 mlr 包的逻辑回归算法介绍与实践(上)关于逻辑回归的介绍内容中主要包括了特征工程、特征选择和缺失值的处理等问题,都是小编之前没有系统学过的机器学习任务。本期逻辑回归内容基于上期进行了扩展,主要包括逻辑回归中的交叉验证、odds ratio 和预测等。
该网站一共汇总了 109 种与ggplot2 包相关的拓展包,并且在不断更新中。拓展包与 ggplot2 包可以无缝连接。
以下快捷键为平时小编用的比较多的,以前总是记不住这些枯燥的快捷键,只好找小本本记下,想用的时候翻翻本子,用着用着就印在脑子里了。现在整理起来写篇推送还是非常有意义的,这次配上小视频(gif),以便大家记忆。星数(⭐)表示常用指数,满星3颗,星越多越需要记下使用噢!
本期介绍的是 《Machine Learning with R, tidyverse, and mlr》 一书的第四章——逻辑回归(logistic regression)。逻辑回归是基于概率分类的有监督学习算法,它依赖于直线方程,产生的模型非常容易解释和交流。在其最简单的形式中,逻辑回归被用来预测二分类问题,但算法的变体也可以处理多个类。
本期介绍的是 《Machine Learning with R, tidyverse, and mlr》 一书的第四章——逻辑回归(logistic regression)。逻辑回归是基于概率分类的有监督学习算法,它依赖于直线方程,产生的模型非常容易解释和交流。在其最简单的形式中,逻辑回归被用来预测二分类问题,但算法的变体也可以处理多个类。
在业务场景中,维度和指标是基础,清晰准确地定义维度和指标能帮助我们更好地探寻数字背后的含义。下图列举了一些电商常用的指标和维度,你能正确区分吗?
在上期 KNN 算法介绍 的最后,我们指出:使用最初用来训练模型的数据进行预测的方式来评估模型性能是不合理的。本期将以上期的内容和数据为基础,介绍交叉验证的方法来评估模型性能、如何选择参数 k 来优化模型等内容。
这里是林小编的新模块 ~ 一直想系统学习一下 R 语言关于机器学习的应用,主要从算法和 R 包的角度出发,并把自己的学习笔记分享出来,希望大家可以批评指正,一起交流,主要参考书是 《Machine Learning with R, tidyverse, and mlr[1]》,本书涉及两个非常重要的 R 包为 mlr 和 tidyverse,感兴趣的读者可以先行安装其中,mlr 包含了数量惊人的机器学习算法,并极大地简化了我们所有的机器学习任务。tidyverse 是一个 “专为数据科学设计的 R 包集合”,创建的目的是让 R 中的数据科学任务更简单、更人性化、更可复制。 本期将先从常用的 k
让使用者将注意力集中在参数设定与调整上,而不是代码使用的细节,类似于一个芯片封装的过程。对几个常用的绘图函数进行了封装,并调整为印刷风格供使用者做课题或写论文参考。
我们对 leaflet 包做了一期简单的入门教程:空间地理数据可视化之 leaflet 包及其拓展。之后,又将高德和该包相结合,介绍了前期需要准备的工作,见:Leaflet 与高德合并会擦出怎么样的火花?。这一期就到了绘制地图环节,下面将分享三类数据的绘制教程。
本文介绍如何下载某期刊的 LaTeX 模板,并为我所用。这里以 IEEE 协会的期刊为例子。
最近科研绘图中,需要解决这么一个需求。如何将下图中的左图(低配版)转化为右图(高配版, x,y 轴分离)。
通常情况下,我们更关心的是构建统计模型的过程,而对于可视化模型结果都希望能快速完成。尽管一些包为生成的数据和模型提供默认的可视化。但是,它们看起来已经过时了,并且在 ggplot2 中使用它们之前,这些组件需要进行额外的转换和清理,当其他人希望在分析中生成类似的图表时,必须复制这些转换步骤。
gghalves可以通过ggplot2轻松地编写自己想要的一半一半(half-half plots)的图片。比如:在散点旁边显示箱线图、在小提琴图旁边显示点图。
先和大家说一句圣诞快乐呀,最近 DIY 涂鸦圣诞树非常受欢迎,小编琢磨着能否用 R 语言来绘制一颗圣诞树呢,最后终于让小编找到了教程[1],这不赶紧在今天分享出来给大家,一起动手试一试吧~
很多读者会在群里问一些绘图细节的问题,而对于这些问题,小编也不大会啊!实在没办法就用Adobe Illustator (AI) 来帮忙吧。今天就简单介绍下,如何安装和使用这个软件。
Lindia 是 ggplot2 的扩展,提供更详细的线性模型诊断结果的可视化功能。Lindia 中的所有函数输入都必须为 lm 对象(包括 lm()和 glm() ),并以 ggplot 对象的形式返回线性诊断图。
今天小编在做线性回归的时候,突然想 R 能不能把结果以表格的形式输出呢?这样就不需要自己复制粘贴画表格啦。小编搜了一下果然有相关的 R 包—— stargazer ,现将自己关于该包的一些学习笔记分享给大家。
上期我们说了气泡图。如果我们将气泡图的三维数据绘制到三维坐标系[1]中,通常称其为三维散点图,即用在三维X-Y-Z图上针对一个或多个数据序列绘出三个度量的一种图表。
mice包帮助我们用可信的数据值来填补缺失值,这些可信的数据值是根据原始数据分布特征得到的。该包为多元缺失数据创建多个输入(替换值),其中每个不完全变量由一个单独的模型输入。MICE 算法支持输入的数据类型有:连续的、二值的、无序分类和有序分类数据。
之前公众号介绍过的绘图工具:如何快速画出美观的图形?,图表这么多,该用哪种展示我的数据呢?使用的语言都为 python,对于一些 R 语言爱好者就不是那么方便啦,今天小编为大家介绍一个支持 R 语言的开源图形库—— Plotly,赶紧收藏起来,迅速 get 绘制美观实用的图形技能吧~
本期开始之前,小编想问大家一个问题:对于一场数学考试,分数高的应试者一定比分数低的应试者能力高吗?答案显然是否定的。那如何通过一场测试来衡量一个人在某方面的能力呢?当然是项目反应理论(item response theory, IRT)![1]
你是不是特别想创建一个自己的私人博客?以及为什么要使用 blogdown 搭建博客?难度是不是很大,和其他搭建博客而言有什么优点? 在小编使用过一段时间后,个人认为 blogdown 搭建博客的优势在于,将 Rmarkdown 与 hugo 相结合,再加上 github 和一个可以部署的网站。你可以轻松的将一篇篇 Rmarkdown 的文章自动上传上去。而 Rmarkdown 的优势在于,你的代码结果都可以轻松呈现。而不是“复制粘贴”结果!
你是不是特别想创建一个自己的私人博客?以及为什么要使用 blogdown 搭建博客?难度是不是很大,和其他搭建博客而言有什么优点? 在小编使用过一段时间后,个人认为 blogdown 搭建博客的优势在于,将 Rmarkdown 与 hugo 相结合,再加上 github 和一个可以部署的网站。你可以轻松的将一篇篇 Rmarkdown 的文章自动上传上去。而 Rmarkdown 的优势在于,你的代码结果都可以轻松呈现。而不是“复制粘贴”结果!
用 word 编辑文章的时候,你有为敲公式而感到头疼吗?即便 latex 输入公式较于 word 更加方便快捷,但是它繁多的公式符号也是让人头大呀。
上次可视化系列说了瀑布图(可跳转)。它可以用于展示拥有相同的X轴变量数据(如相同的时间序列)、不同的Y轴离散型变量(如不同的类别变量)和Z轴数值变量。 本节使用的峰峦图也可以很好地展示瀑布图的数据信息。它们对于可视化随时间或空间分布的变化非常有用。本节主要使用ggridges包[1]中的geom_density_ridges()进行绘制峰峦图。
最近学习可视化时发现了一个好用的包,可以直接使用“拖拽”的方式生成绘图,不需要写任何代码!这个包是esquisse,具体介绍可以见对应的github[1]。这是建立在ggplot2包[2]基础上设计的。你可以通过生成ggplot2图表以交互方式探索esquisse环境中的数据。入门门槛极低,有点类似tableau的感觉。
最近在做毕业答辩的幻灯片,由于是需要中文的模板,但 overleaf [1]给出的中文模板不是很多(主要还是外国的网站)。正好上次一位读者想我推荐了一个中国版本的“overleaf”,点击进入后发现,哎,找到了挺多中文模板啊!果真是中国企业办的。
上次赵小编给大家介绍了如何使用 Echarts 进行图形可视化,可见:如何快速画出美观的图形?。但是有些小伙伴问到:我应该怎么选择图表来展示我的数据呢?
写论文很多小伙伴会使用 latex 作为排版工具,但是实验数据结果却存储在 excel 中。怎么高效的将 excel 中大篇幅的数据一键导入到 latex 中呢?这个问题肯定困扰很多科研人员,今天小编给你推荐一个常用的表格转换网站。
这个是通过《艺术绘》视频号看到的一个小短篇,莫奈大师的配色果真高级。于是小编有了这么一个想法:虽然我不会画画,但是我会画科研图啊!作为实力型搬运工,我把这配色搬到了公众号里,并且尝试使用这些配色加入到 R 可视化中。
今天赵小编给大家推荐一个非常实用绘图的网站 ECHARTS[1](文末原文链接直达) 在这个网站上你可以在线免费绘制多种图形,帮助大家更轻松地创造满足各种场景需求的可视化作品,绝对是绘图的超赞工具,赶紧收藏链接吧~
今日内容比较“无用”,觉得比较好玩,所以就做一期“异类”可视化啦!主要介绍下 brickr[1] 包,它将乐高(LEGO) 带入 R 和 tidyverse 生态系统中,该包分为2个部分: • Mosaics(马赛克)[2]:将图像转换为乐高积木的马赛克图像。 • 3D 模型[3]:使用 rgl 包,通过数据表构建 3D 乐高模型。 今天这一期主要介绍第一个部分:
从公众号创建到如今快一年了,坚持写了一年的推文(130多篇原创),从 0 粉丝到如今一万多粉丝,感谢各位读者分享和支持💪。
最近在看一些关于贝叶斯深度学习在可靠性方向应用的文章,看到下面这篇文章,发表在可靠性方向顶刊的 ITR 中。
今天赵小编给大家推荐一个非常实用的网站 processon[1](文末原文链接直达)。 在这个网站上你可以在线免费绘制流程图、思维导图、ER 图等诸多实用的工具图,还支持免费导出,赶紧收藏这个在线图形工具箱吧~
本文主要是基于:R沟通|使用 Blogdown 构建个人博客写的。所以一定要先把前面这一篇做好,项目创建好,网站部署好后,再做接下来的创建 rmd 文件,保存,github 提交,之后过几分钟网站就会自动同步你的最新博客啦!
你是不是特别想创建一个自己的私人博客?以及为什么要使用 blogdown 搭建博客?难度是不是很大,和其他搭建博客而言有什么优点? 在小编使用过一段时间后,个人认为 blogdown 搭建博客的优势在于,将 Rmarkdown 与 hugo 相结合,再加上 github 和一个可以部署的网站。你可以轻松的将一篇篇 Rmarkdown 的文章自动上传上去。而 Rmarkdown 的优势在于,你的代码结果都可以轻松呈现。而不是“复制粘贴”结果!
今天赵小编给大家推荐一个非常实用的网站 papers with code[1](文末原文链接直达) 在这个网站上你可以检索论文并且还能获得该论文对应的代码,这样就可以通过复现他人的实验结果来加深对论文方法的理解,赶紧收藏链接吧~
昨晚在看公众号的时候,发生信技能树写了这么一篇文章:你还在复制粘贴一个Rproject文件吗。在 windows 中使用 ContextMenuManager 帮助你右键新建一个 Rproject 文件。
有好多读者问我: “闪闪,xxx方法/xxx方向有什么包可以推荐的吗,我不会用呀!” 每次遇到这种情况的时候,只要和我专业不大相关的,我真的回答不来,隔行如隔山!所以我就只能回答: 不好意思,这个方向我不懂🤤。 场面一度尴尬。有时更尴尬的事,“好奇”的读者会说: “哎,我以为统计专业,这些都会的呢。” emmm,小编很无奈,苦笑一下。现在,有了这个网站你可以查阅各个领域用到的包和其主要用途。接下来,详细介绍一下。
最近在做论文模拟实验并将实验结果进行可视化。下面是我这阶段的一些经验总结,在此记录下,也希望能够帮助到你。
Dashboards入门前三期可见:R文档沟通|Dashboards入门(1);R文档沟通|Dashboards入门(2);R文档沟通|Dashboards入门(3),今天给出该系列最后一期:在Dashboards中添加 Shiny应用。内容比较少,最后给出一些拓展资料供大家参考。
早上听完讲座才想起来,今天520了。那这样吧,小编给做了个小小的惊喜给读者们,年轻的盆友可以用这“小玩意”给自己心仪的对象表白了。
前面推了两期有关dashboards的推文,可见:R文档沟通|Dashboards入门(1);R文档沟通|Dashboards入门(2)
前段时间小编给大家推荐了一个markdown的IDE编辑器:Typora,具体推文如下:R沟通|markdown编辑器—Typora 和 R沟通 | 如何在Typora中设置免费的图床。今天针对文字颜色变化做一个演示,主要参考知乎:演奇[1]的回答。
关于仪表盘布局的总体规则是: • 一级标题:生成页面; • 二级标题:生成列(或行); • 三级标题:生成框(包含一个或多个仪表盘组件)。