R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)

简介: R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)

因子设计相对于一次一个因子设计的优势

假设一次只研究一个因素。例如,在将浓度保持在 20% (-1) 并将催化剂保持在 B (+1) 时研究温度。

为了使效果具有更普遍的相关性,有必要使效果在所有其他浓度和催化剂水平上都相同。换句话说,因素(例如,温度和催化剂)之间没有相互作用。如果效果相同,则因子设计更有效,因为效果的估计需要更少的观察来达到相同的精度。

如果在其他浓度和催化剂水平下效果不同,则阶乘可以检测和估计相互作用。

非重复因子设计中的正态图

正态分位数图

一组数据的正态性可以通过以下方法来评估。让 表示的有序值 . 例如,r(1) 是 r1,...,rN 的最小值,r(N) 是 r1,...,rN 的最大值。所以,如果数据是:-1, 2, -10, 20, 那么

N(0,1)的累积分布函数 (CDF) 具有 S 形。

x <- seq
plot(x,pnorm)

因此,一组数据的正态性检验是绘制数据的有序值 r(i) 与 pi=(i-0.5)/N 的关系。如果该图与正态 CDF 具有相同的 S 形,则这表明数据来自正态分布。

下面是从图中模拟的 1000 个随机样本的 r(i) 与 pi=(i−0.5)/N,i=1,...,N 的关系图

N <- 1000
x <- rnorm(N)
p <- ((1:N)-0.5)/N
plot

我们还可以构建一个正态的分位数-分位数图。可以证明 Φ(r(i))Φ(r(i)) 在 [0,1] 上具有均匀分布。这意味着 E(Φ(r(i)))=i/(N+1)(这是来自 [0,1] 上的均匀分布的第 i 阶统计量的期望值。

这意味着 N 点 (pi,Φ(r(i))) 应该落在一条直线上。现在将 Φ−1 变换应用于水平和垂直尺度。N个点

形成正态概率图 . 如果 是从正态分布生成的,然后是点图 应该是一条直线。

在 R qnorm() 中是 Φ-1。

plot(qnorm(p),sort(x))

我们通常使用内置函数 qqnorm() (并 qqline() 添加一条直线进行比较)来生成 QQ 图。请注意,R 使用稍微更通用的分位数 (pi=(1−a)/(N+(1−a)−a),其中 a=3/8,如果 N≤10,a=1/2,如果N>10。

qqnorm(x);qqline(x)

该图与直线的显着(系统性)偏差表明:

  • 正态假设不成立。
  • 方差不是恒定的。

一个主要应用是在因子设计中,其中 r(i) 被有序因子效应代替。设 ^θ(1)<^θ(2)<⋯<^θ(N) 为 N 个有序因子估计。如果我们绘制

那么接近 0 的阶乘效应 ^θi 将沿直线下降。因此,偏离直线的点将被认为是重要点。

基本原理如下:1. 假设估计效应 ^θi 为 N(θ,σ)(估计效应涉及 N 个观测值的平均值,CLT 确保 N 小至 8 的平均值接近正态)。2. 如果 H0:θi=0,i=1,...,N 为真,那么所有估计的影响都将为零。3. 估计效应的结果正态概率图将是一条直线。4. 因此,正态概率图是检验所有估计的效应是否具有相同的分布(即相同的均值)。

  • 当一些效应不为零时,相应的估计效应将趋于更大并偏离直线。
  • 对于正面影响,估计的影响落在该线之上,而负面影响落在该线之下。

示例 - 研究化学反应的设计

一个工艺开发实验研究了四个因素 因子设计:催化剂装料量 1、温度 2、压力 3和其中一种反应物的浓度 4。因变量 y 是 16 个运行条件中每个条件下的转化百分比。该设计如下图所示。

该设计未重复,因此无法估计因子效应的标准误差。

fct1 <- lm

可以获得因子效应的正态图 。

Plot(fac

对应的效果 x1, x4, x2:x4, x2 不会沿着直线下降。

半正态图

相关的图形方法称为半正态概率图。让

表示无标识因子效应估计的有序值。

根据半正态分布的坐标绘制它们 - 正态随机变量的绝对值具有半正态分布。

半正态概率图由点组成

该图的一个优点是所有较大的估计效应都出现在右上角并落在该线之上。

可以获得过程开发示例中效果的半正态图half = TRUE

Lenth 方法:检验没有方差估计的实验的显着性

半正态图和正态图是涉及视觉判断的非正式图形方法。最好根据正式的显着性检验来定量地判断与直线的偏差。

在 2k 设计 N=2k-1 中估计 θ1,θ2,...,θN的因子效应。假设所有因子效应具有相同的标准差。

伪标准误差 (PSE) 定义为

其中中位数是在 ∣∣^θi∣ 中计算的

估计的因子效应为:

ef <- 2*fat1$coeffic

s0=1.5⋅median∣∣^θi∣∣的估计是

s0 <- 1.5*median(abs(eff))
s0

修整常数 2.5s0 是

2.5*s0

∣∣^θi∣∣≥2.5s0 的效果 ^θi 将被修剪。下面是标记为 TRUE ( x1,x2,x4,x2:x4)的效果

abs(eff)<2.5*s0

然后将 PSE 计算为这些值中位数的 1.5 倍。

PE <- 1.5*median
PE

ME 和 SME 是

ME <- PE*qt
ME

PE*qt(p =(1+.95^{1/15})/2,df=(16-1)/3)

因此,效果的 95% 置信区间为:

lor <- round(ef-ME,2)
uper <- round(ef+ME,2)
kable(cbind)

具有 ME 和 SME 的效果图通常称为 Lenth 图。PSE,ME,SMEPSE,ME,SME 的值是输出的一部分。下图中的尖峰用于显示因子效应。

Plot(fat1,cex.fac = 0.5)

该选项 cex.fac = 0.5 调整用于因子标签的字符大小。

相关文章
|
6天前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
6天前
R语言表与因子(详细知识点,深入知识点后续会补充!)
R语言表与因子(详细知识点,深入知识点后续会补充!)
8 2
|
6天前
|
数据可视化 算法
【R语言实战】——kNN和朴素贝叶斯方法实战
【R语言实战】——kNN和朴素贝叶斯方法实战
|
6天前
|
Web App开发 数据可视化 数据挖掘
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
|
6天前
|
数据采集 数据可视化
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
|
6天前
|
移动开发 数据可视化
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
|
6天前
|
机器学习/深度学习 数据可视化
R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码
R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码
|
6天前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
6天前
利用R语言进行典型相关分析实战
利用R语言进行典型相关分析实战
|
6天前
|
机器学习/深度学习 算法
R语言分类回归分析考研热现象分析与考研意愿价值变现
R语言分类回归分析考研热现象分析与考研意愿价值变现

热门文章

最新文章