夜神moon_个人页

夜神moon

文章

问答

视频

个人介绍

南方医科大学外科硕士

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

发表了文章 2018-05-25

差异分析①

加载数据 setwd("D:\\diff") # Reading in count data files
发表了文章 2018-05-04

foreach rf

library(randomForest) library(foreach) library(cvTools) set.seed(1234) K =10 R = 3 cv
发表了文章 2018-03-08

机器学习识别乳腺癌

简介人工神经网络是一种类似于大脑神经突触连接的结构进行信息处理的数学模型，由大量的输入层节点、隐藏层节点和输出层节点连接构成。有关神经网络算法最核心的三个问题就是：选择激活函数、隐藏层数目和节点的确定以及权重的设置。
发表了文章 2018-02-17

过拟合和欠拟合

机器学习中的逼近目标函数过程监督式机器学习通常理解为逼近一个目标函数,此函数映射输入变量(X)到输出变量(Y).Y=f(X)。从训练数据中学习目标函数的过程中，我们必须考虑的问题是模型在预测新数据时的泛化性能。
发表了文章 2018-02-17

监督式和非监督式机器学习算法

监督式机器学习实际应用中的机器学习在大部分情况下我们都会使用监督式学习。监督式学习指的是你拥有一个输入变量和一个输出变量，使用某种算法去学习从输入到输出的映射函数这种学习方式就称之为监督式学习，因为算法学习从训练数据集学习的过程可以被看成类似于一名教师在监督学习学习的过程。
发表了文章 2018-02-13

R lasso

library(HDeconometrics) data("BRinf") data=embed(BRinf,2) y=data[,1]; x=data[,-c(1:ncol(BRinf))] ## == Break the data into in-sample and out-of-sample y.
发表了文章 2018-02-12

py 决策树①

特点它总是在沿着特征做切分。随着层层递进，这个划分会越来越细。虽然生成的树不容易给用户看，但是数据分析的时候，通过观察树的上层结构，能够对分类器的核心思路有一个直观的感受。
发表了文章 2018-01-31

黑箱方法支持向量机②

支持向量机 1. R中svm介绍 R的函数包e1071提供了libsvm的接口。使用e1071包中svm函数可以得到与libsvm相同的结果。write.svm()更是可以把R训练得到的结果写为标准的Libsvm格式，以供其他环境下libsvm的使用。
发表了文章 2018-01-30

R 交叉验证①

什么是交叉验证？在机器学习中，交叉验证是一种重新采样的方法，用于模型评估，以避免在同一数据集上测试模型。交叉验证的概念实际上很简单:我们可以将数据随机分为训练和测试数据集，而不是使用整个数据集来训练和测试相同的数据。
发表了文章 2018-01-30

R 相关性分析

R 相关性分析 1. 相关性矩阵计算：加载mtcars数据 > setwd("E:\\Rwork") > data("mtcars") > head(mtcars) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.
发表了文章 2018-01-27

无监督学习聚类分析④

无监督学习聚类分析④ EM（Expectation Maximization Algorithm） 1.EM算法的基本思想假如我们随机选取了100名男生和100名女生，两百个人混在一起，而目前只有每个人学生的身高数据，我们既不知道每个身高数据所对应的性别，也不知道男生和女生两个群体的总体身高分布情况。
发表了文章 2018-01-27

无监督学习聚类分析③

确定最佳聚类数目 Nbclust包 Nbclust包是《R语言实战》上一个包，定义了几十个评估指标，聚类数目从2遍历到15（自己设定），然后通过这些指标看分别在聚类数为多少时达到最优，最后选择指标支持数最多的聚类数目就是最佳聚类数目。
发表了文章 2018-01-25

R 数据质量分析①

数据质量分析数据质量分析是数据挖掘中数据准备的最重要一环，是数据处理的前体。数据质量分分析主要任务是识别脏数据。常见的脏数据包括：缺失值异常值不一致的值重复数据或者包括特殊符号的数据缺失值处理处理数据缺失的一般步骤：识别缺失数据检测导致数据缺失的原因删除包含缺失值的实例或用合理的数值代替（插补）缺失值。
发表了文章 2018-01-25

娱乐太极图

plotrix画太极图 library(plotrix) #cycle.y is used to calculate the y-coordinates cycle.y (center.x+radius)||min(x)
发表了文章 2018-01-24

机器学习算法①

机器学习算法广泛地说，有三种类型的机器学习算法。 1.监督学习这个算法由一个目标/结果变量（或因变量）组成，这个变量可以从一组给定的预测变量（独立变量）中预测出来。
发表了文章 2018-01-22

R 热图绘制heatmap②

使用pheatmap包绘制热图一般而言，pheatmap较heatmap.2等更为简洁以及易于理解，对于初学者而言是一款不错的热图绘制软件。 rm(list=ls()) setwd("E:\\Rwork") library(pheatmap) ...
发表了文章 2018-01-21

R 热图绘制heatmap①

R.package heatmap():用于绘制简单热图的函数 heatmap.2():绘制增强热图的函数 d3heatmap:用于绘制交互式热图的R包 ComplexHeatmap:用于绘制、注释和排列复杂热图的R&bioconductor包（非...
发表了文章 2018-01-21

R 梯度提升算法①

用gbm包实现随机梯度提升算法自适应提升方法AdaBoost 它是一种传统而重要的Boost算法，在学习时为每一个样本赋上一个权重，初始时各样本权重一样。
发表了文章 2018-01-20

R 支持向量机②

介绍支持向量机是一个相对较新和较先进的机器学习技术，最初提出是为了解决二类分类问题，现在被广泛用于解决多类非线性分类问题和回归问题。其流行归功于两个方面，一个方面，可以输出比较准确的预测结果；另一方面，模型基于比较优雅的数学理论。
发表了文章 2018-01-19

R 支持向量机①

机器学习 R语言有很多包可以做机器学习（Machine Learning）的任务。机器学习的任务主要有有监督的学习方式和无监督的学习方式。有监督学习：在正确结果指导下的学习方式，若是正确结果是定性的，属于分类问题；若正确结果是定量的，属于回归问题。
发表了文章 2018-01-18

R 数据处理 ①

数据采样： setwd("E:\\Rwork") set.seed(1234) index
发表了文章 2018-01-18

R 集成算法④ 梯度提升树

介绍 Boosting是一类将弱学习器提升为强学习器的算法。这类算法的工作机制类似：先从初始训练集中训练出一个基学习器，再根据基学习器的表现对训练样本分布进行调整，使得先前基学习器做错的训练样本在后续受到更多关注。
发表了文章 2018-01-16

R语言朴素贝叶斯分类器①

朴素贝叶斯分类器原理：这种学习方法基于条件概率，也就是通过已经给定的东西来推断一件事情的发生可能性。朴素贝叶斯应用了贝叶斯定理和朴素独立性假设。
发表了文章 2018-01-15

python logistic回归

常用的分类与预测算法回归分析决策树人工神经网络贝叶斯网络支持向量机其中回归分析包括：线性回归---自变量因变量线性关系，最小二乘法求解。
发表了文章 2018-01-15

R语言 ROC曲线

ROC曲线（受试者工作特征， Receiver Operating Characteristic) 可以简单、直观得观察分析方法的临床准确性，并可用肉眼作出判断。
发表了文章 2018-01-14

黑箱方法支持向量机①

1. 介绍支持向量机(Support Vector Machine，SVM)是Corinna Cortes和Vapnik等于1995年首先提出的，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中。
发表了文章 2018-01-13

主成分分析①

简述主成分分析（Principal Component Analysis，PCA）是一种在损失很少信息的前提下，把多个指标转化为几个综合指标的多元统计分析方法，它的核心是数据降维思想，即通过降维的手段实现多指标向综合指标的转化，而转化后的综合指标，我们称之为主成分。
发表了文章 2018-01-12

无监督学习聚类分析②

划分聚类分析 K 均值聚类最常见的划分方法是K均值聚类分析。从概念上讲，K均值算法如下：选择K个中心点（随机选择K行）；把每个数据点分配到离它最近的中心点；重新计算每类中的点到该类中心点距离的平均值（也就说，得到长度为p的均值向量，这里的p是变量的个数）；分配每个数据到它最近的中心点；重复步骤(3)和步骤(4)直到所有的观测值不再被分配或是达到最大的迭代次数（R把10次作为默认迭代次数）。
发表了文章 2018-01-11

无监督学习聚类分析①

聚类分析介绍聚类分析是一种数据规约技术，旨在借楼一个数据集中观测值的子集。他可以把大量的观测值归约未若干类。聚类分析被广泛应用于生物和行为科学，市场以及医学研究中。
发表了文章 2018-01-10

R 集成算法③ 随机森林

1.介绍如前文所述，随机森林目前拥有比较好的正确率，在各种数据中表现位于前列。随机森林顾名思义，是用随机的方式建立一个森林，森林里面有很多的决策树组成，随机森林的每一棵决策树之间是没有关联的。
发表了文章 2018-01-07

黑箱方法-神经网络①

人工神经网络人工神经网络的概念人工神经网络（Artificial Neural Networks，ANN）是对一组输入信号和一组输出信号之间的关系进行建模，使用的模型来源于人类大脑对来自感觉输入的刺激是如何反应的理解。
发表了文章 2018-01-07

python基础①

改变工作环境 import os os.chdir("I:\\pythonwork") os.getcwd() 'I:\\pythonwork' for循环 cities = ["beijing","shanghai","guangzhou"] fo...
发表了文章 2018-01-05

R语言for循环①

for循环是一种重复控制结构，可以让您有效地编写一个需要执行特定次数的循环。 for (value in vector) { statements } 示例： j a for (i in c(1:length(a))) + {pr...

暂无更多信息

发表了文章 2018-10-19

癌症免疫系列（6）
发表了文章 2018-10-19

癌症免疫系列（0）
发表了文章 2018-10-19

癌症免疫系列（5）
发表了文章 2018-10-19

癌症免疫系列（4）
发表了文章 2018-10-19

癌症免疫系列（2）
发表了文章 2018-10-19

癌症免疫系列（1）
发表了文章 2018-10-18

机器学习实战⑴之线性回归预测房价
发表了文章 2018-10-17

python机器学习速成|1|数据导入
发表了文章 2018-10-17

使用R语言进行机器学习特征选择②
发表了文章 2018-10-13

机器器学习算法系列列（1）：随机森林
发表了文章 2018-10-13

pandas VS baseR
发表了文章 2018-10-12

使用R语言进行机器学习特征选择①
发表了文章 2018-10-07

Potent immunogenicity in BRCA1-mutated patients with high-grade serous ovarian carcinoma
发表了文章 2018-10-05

使用R语言分析微信好友
发表了文章 2018-10-05

使用python分析微信好友
发表了文章 2018-10-03

社交网络分析(Social Network Analysis in Python)①
发表了文章 2018-10-03

Python Vs R：数据科学家的永恒问题
发表了文章 2018-10-01

python可视化(1)--箱图
发表了文章 2018-09-30

factoextra包聚类分析（2）
发表了文章 2018-09-28

R语言循环作图

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

夜神moon_个人页

个人介绍

擅长的技术

差异分析①

foreach rf

机器学习识别乳腺癌

过拟合和欠拟合

监督式和非监督式机器学习算法

R lasso

py 决策树①

黑箱方法 支持向量机②

R 交叉验证①

R 相关性分析

无监督学习 聚类分析④

无监督学习 聚类分析③

R 数据质量分析①

娱乐 太极图

机器学习算法①

R 热图绘制heatmap②

R 热图绘制heatmap①

R 梯度提升算法①

R 支持向量机②

R 支持向量机①

R 数据处理 ①

R 集成算法④ 梯度提升树

R语言 朴素贝叶斯分类器①

python logistic回归

R语言 ROC曲线

黑箱方法 支持向量机①

主成分分析①

无监督学习 聚类分析②

无监督学习 聚类分析①

R 集成算法③ 随机森林

黑箱方法-神经网络①

python基础①

R语言for循环①

癌症免疫系列（6）

癌症免疫系列（0）

癌症免疫系列（5）

癌症免疫系列（4）

癌症免疫系列（2）

癌症免疫系列（1）

机器学习实战⑴之线性回归预测房价

python机器学习速成|1|数据导入

使用R语言进行机器学习特征选择②

机器器学习算法系列列（1）：随机森林

pandas VS baseR

使用R语言进行机器学习特征选择①

Potent immunogenicity in BRCA1-mutated patients with high-grade serous ovarian carcinoma

使用R语言分析微信好友

使用python分析微信好友

社交网络分析(Social Network Analysis in Python)①

Python Vs R：数据科学家的永恒问题

python可视化(1)--箱图

factoextra包 聚类分析（2）

R语言 循环作图

黑箱方法支持向量机②

无监督学习聚类分析④

无监督学习聚类分析③

娱乐太极图

R语言朴素贝叶斯分类器①

黑箱方法支持向量机①

无监督学习聚类分析②

无监督学习聚类分析①

factoextra包聚类分析（2）

R语言循环作图