导航菜单
首页 >  数据分析真题怎么做的  > 非正态分布的数据,该怎么做差异性分析?

非正态分布的数据,该怎么做差异性分析?

非正态分布的数据,该怎么做差异性分析?模型讲解https://www.spsspro.com/ · 3463浏览 · 2022-05-06 02:23举报不满足正态分布的数据该如何处理

我们在做差异性分析时,常用的t检验、方差分析都要求样本服从正态分布,但如果数据本来就不应该是正态的,例如房价、收入,满意度打分等,亦或者其它情况,如果没有满足前提条件就强行进行参数检验,分析结果会变得不科学严谨,分析结论会受到置疑。

所以不满足正态分布时应该如何处理呢?接下来会逐步说明并介绍常见的非参数检验。

根据数据是否符合正态分布,分为:参数检验

对参数平均值、方差进行的统计检验。先由测得的样本数据计算检验统计量,若计算的统计量值落入约定显著性水平a 时的拒绝域内,说明被检参数之间在所约定的显著性水平a 下在统计上有显著性差异

分为平均值、单样本t检验、独立样本t检验、配对样本t检验、方差分析等等。

非参数检验

在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法,在推断过程中不涉及有关总体分布的参数

理论上满足正态分布,但现实情况不满足可能的原因:抽样样本过少,导致总体是正态分布,但抽样样本不满足正态分布绝对正态分布很难满足,可以结合正态分布直方图以及峰度(绝对值小于 10)、偏度(绝对值小于 3)进一步分析,如果数据分布基本满足“钟形曲线”特征,可以描述为基本符合正态分布。

image.png

小样本(小于50)时建议使用S-W检验,大样本(大于50)时建议使用K-S检验

image.png

常见的非参数检验方法:1个样本:单样本Wilcoxon符号秩检验2个独立样本:独立样本MannWhitney检验2个相关样本:配对样本Wilcoxon符号秩检验3个及以上独立样本:多独立样本Kruskal-Wallis检验3个及以上相关样本:多配对样本Friedman检验差异性分析方法汇总如下:

image.png

下面我们针对上面列出的几个常用的非参数检验逐一进行分析。

1、单样本Wilcoxon符号秩检验

用于比较样本数据中位数与一个特定数值之间的差异情况

示例:如研究一家食品生产企业的罐装食品标准重量是不是 100g(数据非正态分布)

image.png

操作过程

image.png

检验结果

image.png

P

相关推荐: