数据分析干货集合贴:方差分析!知乎最全!

方差分析用于分析定类数据与定量数据之间的关系情况,具体分析如下:

一、何为方差分析?

方差分析用于分析定类数据与定量数据之间的关系情况。例如研究人员想知道三组学生的智商平均值是否有显著差异。方差分析可用于多组数据,比如本科以下,本科,本科以上***三组的差异。

方差分析,从内容来说,是分析或检验多个样本的均值间是否有所不同,虽然它叫方差分析,但不是检验方差是否有不同。只是说它检验所用的方法或手段是通过方差来进行的。

如何进行方差分析呢?

二、方差分析细分

方差分析分类情况如下所示:

(一)单因素方差分析

单因素方差分析用于分析定类数据与定量数据之间的关系情况.例如研究人员想知道三组学生的智商平均值是否有显著差异。单因素方差有以下前提假设:

观测值相互独立。

没有明显异常值。

各观测变量总体要服从正态分布。

各观测变量的总体满足方差齐。

(二)双因素方差分析

双因素方差分析,用于分析2个定类数据与定量数据之间的关系情况。例如研究性别、学历对网购满意度的影响差异;以及男(女)性中,不同学历是否有着网购满意度差异性;或者同一学历时,不同性别是否有着网购满意度差异性。

对比单因素方差分析:

方差分析***同点均是研究不同类别样本对于定量数据的差异,区别在于单因素方差分析仅比较一个分类数据,双因素方差分析可以比较两个分类数据,并且可以研究两个分类数据之间对于定量数据的交互影响关系情况。

单因素方差分析的使用非常普遍;相比之下双因素方差对数据的要求更严格,因而更多用于实验研究。

(三)三因素方差分析

当X为定类数据,Y为定量数据时,通常使用的是方差分析进行差异研究。

X为3个时则称作三因素方差。

(四)多因素方差分析

当X为定类数据,Y为定量数据时,通常使用的是方差分析进行差异研究。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。

当X超过1个时,统称为多因素方差。

(五)协方差分析

在实验研究里,还需要更多的考虑潜在的干扰因素,比如“减肥方式”对于“减肥效果”的影响,年龄很可能是影响因素;同样的减肥方式,但不同年龄的群体,减肥效果却不一样;年龄就属于干扰项,因此在分析的时候需要把它纳入到考虑范畴中。如果方差分析时需要考虑干扰项,此时就称之为协方差分析,而干扰项也称着“协变量”。

(六)重复测量方差

在某些实验研究中,常常需要考虑时间因素对实验的影响,当需要对同一观察单位在不同时间重复进行多次测量,每个样本的测量数据之间存在相关性,因而不能简单的使用方差分析进行研究,而需要使用重复测量方差分析。

三、方差齐检验怎么做?

方差齐检验,用于分析不同定类数据组别对定量数据时的波动情况是否一致.例如研究人员想知道三组学生的智商波动情况是否一致(通常情况希望波动一致,即方差齐)。

四、方差分析下两两对比如何分析?

当我们想研究不同组别下,多组数据的差异性时,通常会选择方差分析。但是方差分析只能得到一个显著性的结果,具体是那些组别有显著差异,我们无法得知。因而还需要对两两组别进行对比。

事后检验正是基于方差分析基础上进行,对比两两组别的差异。

方法选择:

事后检验的方法有多种,但功能均一致,只是在个别点或使用场景上有小区别。SPSSAU目前***提供LSD,Scheffe,Tukey,Bonferroni校正,Tamhane T2常见的五种方法,其中LSD方法最常使用。

SPSSAU-多重比较方法选择。

分析时,首先判断方差分析的p值是否呈现出显著性,如果呈现出显著性,则说明不同组别数据具有显著性差异,差异可通过平均值进行对比;然后可通过事后检验判断具体两两组别之间的差异情况。

如果说X仅两组,则不需要进行事后检验;如果方差分析显示P值大于0.05即说明各个组别之间没有差异性,此时也不需要进行事后检验。

非参数的事后多重比较:

当数据呈现严重的偏态或方差不齐,可考虑使用非参数分析,同样可以进行两两对比。

非参数检验。

如果进行非参数检验Kruskal-Wallis时发现呈现出显著性,可以继续深入研究,对比两两组别之间的差异性,选中“Nemenyi两两比较”即可输出结果。

如果Kruskal-Wallis检验显示没有差异性,则不需要进行两两比较。

五、方差分析与T检验、卡方分析相比有何区别?

方差分析是差异研究分析方法中的一种。差异研究的目的在于比较两组数据或多组数据之间的差异,通常包括3类分析方法,分别是方差分析、T检验和卡方检验。

其实核心的区别在于:数据类型不一样。如果是定类和定类,此时应该使用卡方分析;如果是定类和定量,此时应该使用方差或者T检验。

方差和T检验的区别在于,对于T检验的X来讲,其只能为2个类别比如男和女。如果X为3个类别比如本科以下,本科,本科以上;此时只能使用方差分析。

六、方差分析常见问题

异方差性问题。

在计量经济学中,一些情况下会出现异方差问题,严重的异方差问题会影响模型估计和模型检验等,因而在OLS回归时需要对其进行检验,如果出现异方差问题需要进行对应处理。

异方差性的检测方法:

残差图。

white检验。

BP检验。

异方差性处理方法:

对原数据做对数处理。

使用Robust稳健标准误回归。

FGLS回归。