R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)

简介: R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)

因子设计相对于一次一个因子设计的优势

假设一次只研究一个因素。例如,在将浓度保持在 20% (-1) 并将催化剂保持在 B (+1) 时研究温度。

为了使效果具有更普遍的相关性,有必要使效果在所有其他浓度和催化剂水平上都相同。换句话说,因素(例如,温度和催化剂)之间没有相互作用。如果效果相同,则因子设计更有效,因为效果的估计需要更少的观察来达到相同的精度。

如果在其他浓度和催化剂水平下效果不同,则阶乘可以检测和估计相互作用。

非重复因子设计中的正态图

正态分位数图

一组数据的正态性可以通过以下方法来评估。让 表示的有序值 . 例如,r(1) 是 r1,...,rN 的最小值,r(N) 是 r1,...,rN 的最大值。所以,如果数据是:-1, 2, -10, 20, 那么

N(0,1)的累积分布函数 (CDF) 具有 S 形。

x <- seq
plot(x,pnorm)

因此,一组数据的正态性检验是绘制数据的有序值 r(i) 与 pi=(i-0.5)/N 的关系。如果该图与正态 CDF 具有相同的 S 形,则这表明数据来自正态分布。

下面是从图中模拟的 1000 个随机样本的 r(i) 与 pi=(i−0.5)/N,i=1,...,N 的关系图

N <- 1000
x <- rnorm(N)
p <- ((1:N)-0.5)/N
plot

我们还可以构建一个正态的分位数-分位数图。可以证明 Φ(r(i))Φ(r(i)) 在 [0,1] 上具有均匀分布。这意味着 E(Φ(r(i)))=i/(N+1)(这是来自 [0,1] 上的均匀分布的第 i 阶统计量的期望值。

这意味着 N 点 (pi,Φ(r(i))) 应该落在一条直线上。现在将 Φ−1 变换应用于水平和垂直尺度。N个点

形成正态概率图 . 如果 是从正态分布生成的,然后是点图 应该是一条直线。

在 R qnorm() 中是 Φ-1。

plot(qnorm(p),sort(x))

我们通常使用内置函数 qqnorm() (并 qqline() 添加一条直线进行比较)来生成 QQ 图。请注意,R 使用稍微更通用的分位数 (pi=(1−a)/(N+(1−a)−a),其中 a=3/8,如果 N≤10,a=1/2,如果N>10。

qqnorm(x);qqline(x)

该图与直线的显着(系统性)偏差表明:

  • 正态假设不成立。
  • 方差不是恒定的。

一个主要应用是在因子设计中,其中 r(i) 被有序因子效应代替。设 ^θ(1)<^θ(2)<⋯<^θ(N) 为 N 个有序因子估计。如果我们绘制

那么接近 0 的阶乘效应 ^θi 将沿直线下降。因此,偏离直线的点将被认为是重要点。

基本原理如下:1. 假设估计效应 ^θi 为 N(θ,σ)(估计效应涉及 N 个观测值的平均值,CLT 确保 N 小至 8 的平均值接近正态)。2. 如果 H0:θi=0,i=1,...,N 为真,那么所有估计的影响都将为零。3. 估计效应的结果正态概率图将是一条直线。4. 因此,正态概率图是检验所有估计的效应是否具有相同的分布(即相同的均值)。

  • 当一些效应不为零时,相应的估计效应将趋于更大并偏离直线。
  • 对于正面影响,估计的影响落在该线之上,而负面影响落在该线之下。

示例 - 研究化学反应的设计

一个工艺开发实验研究了四个因素 因子设计:催化剂装料量 1、温度 2、压力 3和其中一种反应物的浓度 4。因变量 y 是 16 个运行条件中每个条件下的转化百分比。该设计如下图所示。

该设计未重复,因此无法估计因子效应的标准误差。

fct1 <- lm

可以获得因子效应的正态图 。

Plot(fac

对应的效果 x1, x4, x2:x4, x2 不会沿着直线下降。

半正态图

相关的图形方法称为半正态概率图。让

表示无标识因子效应估计的有序值。

根据半正态分布的坐标绘制它们 - 正态随机变量的绝对值具有半正态分布。

半正态概率图由点组成

该图的一个优点是所有较大的估计效应都出现在右上角并落在该线之上。

可以获得过程开发示例中效果的半正态图half = TRUE

Lenth 方法:检验没有方差估计的实验的显着性

半正态图和正态图是涉及视觉判断的非正式图形方法。最好根据正式的显着性检验来定量地判断与直线的偏差。

在 2k 设计 N=2k-1 中估计 θ1,θ2,...,θN的因子效应。假设所有因子效应具有相同的标准差。

伪标准误差 (PSE) 定义为

其中中位数是在 ∣∣^θi∣ 中计算的

估计的因子效应为:

ef <- 2*fat1$coeffic

s0=1.5⋅median∣∣^θi∣∣的估计是

s0 <- 1.5*median(abs(eff))
s0

修整常数 2.5s0 是

2.5*s0

∣∣^θi∣∣≥2.5s0 的效果 ^θi 将被修剪。下面是标记为 TRUE ( x1,x2,x4,x2:x4)的效果

abs(eff)<2.5*s0

然后将 PSE 计算为这些值中位数的 1.5 倍。

PE <- 1.5*median
PE

ME 和 SME 是

ME <- PE*qt
ME

PE*qt(p =(1+.95^{1/15})/2,df=(16-1)/3)

因此,效果的 95% 置信区间为:

lor <- round(ef-ME,2)
uper <- round(ef+ME,2)
kable(cbind)

具有 ME 和 SME 的效果图通常称为 Lenth 图。PSE,ME,SMEPSE,ME,SME 的值是输出的一部分。下图中的尖峰用于显示因子效应。

Plot(fat1,cex.fac = 0.5)

该选项 cex.fac = 0.5 调整用于因子标签的字符大小。

相关文章
|
3月前
|
数据可视化 数据挖掘 图形学
R语言基础可视化:使用ggplot2构建精美图形的探索
【8月更文挑战第29天】 `ggplot2`是R语言中一个非常强大的图形构建工具,它基于图形语法提供了一种灵活且直观的方式来创建各种统计图形。通过掌握`ggplot2`的基本用法和美化技巧,你可以轻松地将复杂的数据转化为直观易懂的图形,从而更好地理解和展示你的数据分析结果。希望本文能够为你探索`ggplot2`的世界提供一些帮助和启发。
|
3月前
|
数据可视化 数据挖掘 数据处理
R语言高级可视化技巧:使用Plotly与Shiny制作互动图表
【8月更文挑战第30天】通过使用`plotly`和`shiny`,我们可以轻松地创建高度互动的数据可视化图表。这不仅增强了图表的表现力,还提高了用户与数据的交互性,使得数据探索变得更加直观和高效。本文仅介绍了基本的使用方法,`plotly`和`shiny`还提供了更多高级功能和自定义选项,等待你去探索和发现。希望这篇文章能帮助你掌握使用`plotly`和`shiny`制作互动图表的技巧,并在你的数据分析和可视化工作中发挥更大的作用。
|
3月前
|
数据可视化
R语言可视化设计原则:打造吸引力十足的数据可视化
【8月更文挑战第30天】R语言可视化设计是一个综合性的过程,需要综合运用多个设计原则来创作出吸引力十足的作品。通过明确目标、选择合适的图表类型、合理运用色彩与视觉层次、明确标注与引导视线以及引入互动性与动态效果等原则的应用,你可以显著提升你的数据可视化作品的吸引力和实用性。希望本文能为你提供一些有益的启示和帮助。
|
6月前
R语言表与因子(详细知识点,深入知识点后续会补充!)
R语言表与因子(详细知识点,深入知识点后续会补充!)
46 2
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
21天前
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
40 3
|
6月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
6月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
R语言在数据科学中的应用实例:探索与预测分析
【8月更文挑战第31天】通过上述实例,我们展示了R语言在数据科学中的强大应用。从数据准备、探索、预处理到建模与预测,R语言提供了完整的解决方案和丰富的工具集。当然,数据科学远不止于此,随着技术的不断发展和业务需求的不断变化,我们需要不断学习和探索新的方法和工具,以更好地应对挑战,挖掘数据的潜在价值。 未来,随着大数据和人工智能技术的普及,R语言在数据科学领域的应用将更加广泛和深入。我们期待看到更多创新的应用实例,为各行各业的发展注入新的动力。

热门文章

最新文章