很多研究项目会通过问卷调研的方式获取数据,但由于实际操作或被访者的配合问题,不时会出现问卷数据缺失的问题。一般来说,问卷的数量都会比较多,很难逐一检查是不是有答案缺失的地方,因此,我们都会在SPSS处理数据时检查有没有缺失值。那么,SPSS个案缺失怎么查出来,SPSS个案缺失影响结果吗?
一、SPSS个案缺失怎么查出来
SPSS的个案缺失,就是有些变量的个案数据是空白的。如果数据比较少,可以很快就发现出来;如果数据比较多,就很难通过肉眼观察出来。这时候,我们就要使用SPSS的分析方法来检查,下面给大家介绍描述分析以及缺失值分析这两种方法。
方法一、描述分析是SPSS进行基础数据分析的功能,可以快速了解数据的基本概况。
1、如图1所示,打开SPSS的分析菜单,即可在描述统计里面打开描述分析功能。
图1:描述分析
2、我们这里以一组客流量、销售额、客单价的数据为例,将这些变量都添加到分析变量中,这样我们就能检查每一个变量有没有缺失值。描述分析的设置很简单,如无特殊需求,就可以点击确定输出结果。
图2:描述分析设置
3、在描述分析结果中,如果要看数据有没有缺失,可以看“N”值,也就是个案数量。由于本例的总样本为198,而销售额和客单价的个案数量是197,说明这两个变量都有个案缺失。
图3:描述统计结果
方法二、SPSS缺失值分析功能,相比于描述分析,这个功能会更实用,因为它既可以检查缺失值,也可以计算并替换缺失值。
1、打开SPSS的分析菜单,就能在菜单底部处启用缺失值分析功能。
图4:缺失值分析
2、与描述分析相似,我们要将需要检查的变量都添加到“定量变量”的方框中,其他分类变量、个案标签可以不填。
图5:缺失值分析设置
3、然后,如图6所示,在估算功能中,勾选“EM”、“回归”选项。这两个选项功能可以帮助我们分析缺失值是不是“随机缺失”的,以及缺失值是不是符合某种分布规律。
因为如果缺失值不是随机的,是有人为因素的,比如低收入者故意不回答收入问题,这样就会影响到分析结果的。
图6:估算设置
4、缺失值的输出结果如图7所示,我们可以从“缺失”项目看到销售额缺失3个个案值,客单价缺失1个个案值。
图7:单变量统计
5、那么,这些缺失值是不是随机的呢?我们可以看一下EM的检验结果,如图8所示,结果显示重要性P值为0.177>0.05,拒绝原假设,即我们可以有把握说明缺失数据符合随机分布。
图8:EM检验结果
二、SPSS个案缺失影响结果吗
SPSS个案缺失会不会影响结果,要看个案缺失的数量,以及缺失值是否随机分布。如果缺失值的数量比较少,而且服从完全随机分布,对结果影响不大;如果缺失值的数量比较大,或者缺失值不是随机分布,而是有一定系统性的,可能会导致结果走偏。比如有些低收入人士,可能故意不回答收入相关的问题,会导致统计收入时出现偏高的数值。
如果是随机缺失,可以用SPSS的替换缺失值功能补全。如果是系统缺失,应该尽可能补充收集。
图9:替换缺失值
在SPSS的缺失值替换功能里,如图10所示,我们可以指定缺失值的计算方法,可以选择的方法有序列平均值、线性插值、邻近点的线性趋势等。如果数据比较集中,很少极端值,选择序列平均值就可以了。
图10:替换缺失值设置
应用替换缺失值功能后,SPSS会在右侧生成一个新变量,红圈处是原来变量缺失值的位置,现在已经填充了替换值。
图11:缺失值已替换