在这篇文章中,我将解释为什么当建立一个线性模型,我们添加一个x₁₂术语如果我们认为变量x₁和x₂互动和添加交互条款订立原则方法。
我假设读者对线性模型的工作原理有一个基本的了解。
无交互模型
让我们从构建一个没有相互作用项的模型开始。
假设我们想要模型y的函数x₁和x₂。则描述该关系的线性模型为:
图1:没有相互作用项的线性模型
一个变斜率的模型
假设我们认为x₁实际上取决于x₂的斜率。我们如何将这种信念融入到模型中?
因为我们正在与线性模型,方法之一是模型β₁作为另一个x的函数₂线性模型,如下所示:
图2:假设x1的斜率依赖于x2的效果
将图2的方程代入图1,得到拟合模型如下:
图3:拟合线性模型假定的影响x₁的值取决于x₂
图3中的模型如图1是一模一样,除了它有一个额外的术语,bx x₁₂。
这种方式建立一个线性模型的相互作用项是自然结果表明假设x₁y是线性的影响依赖于x₂的当前值。
x₁ 依赖于 x₂与 x₂ 依赖于 x₁是一样的
前一节中建立在假设x₁的效果取决于x₂的当前值。如果我们有什么做的假设另一个方向即x₂的影响取决于的当前值x₁?
用同样的方法,假设意味着:
图4:假设x₂取决于x₁的斜率
我们最终拟合的模型是这样的:
图5:拟合线性模型假设x₂的影响取决于x₁的值
请注意,上图中的模型与图4中的模型相同(它们仅在分配给系数的名称上有所不同)。
这是一个值得一提的强调,添加一个x₁x₂ 没有说任何关于x₁和x₂之间的因果关系。
涉及两个以上变量的作用
这种增加相互作用项的方法表明,通过递归应用一个变量的斜率依赖于另一个变量的假设,可以得到涉及两个以上变量的交互作用。
例如,假设我们想要模型之间的关系x和y₁, x₂, x₃使用线性模型。
现在,如果我们假设x₁的斜率取决于x₂,我们有:
图6:假设x₁取决于x₂的斜率
如果我们进一步假设x₂在图6的斜率是依赖于x₃,我们得到:
图7:假设x₂β的影响x₁还取决于₃
所以,给定:
图8:y的函数x₁, x₂x₃
我们的结果是:
图9:一个模型假设x₁的影响取决于x₂,而x₂取决于x₃
如果我们曾以为不同的顺序即斜率x₁取决于x₃这取决于x₂?然后,给出:
图10:与图8相同的假设,只是顺序不同
得到:
图11:基于图10中的假设的模型
注意,图11和图9中的模型是不同的。它们在第五项有所不同。
结论
本文表明,相互作用项可以解释为假设一个特定变量的斜率依赖于另一个变量的值。
使用这种方法,我们就有了一种系统的方法,使用我们的领域知识来智能地添加相互作用项,而不是在我们的数据集中添加所有可能的变量组合。后一种方法可能导致模型过度拟合和/或给出错误的因果推断。