卡方检验(Chi-square test),即考察样本值与理论值之间的偏离程度,偏离程度反映了卡方值的大小,卡方值越大,样本值偏离越大;卡方值越小,偏离越小,若样本值与理论值完全相等时,卡方值为0,表明两者完全符合。
数据分析分析研究中,常用卡方分析来检验不同变量之间的差异,如试验组与对照组之间、A组与B组之间等、分类变量之间的关联性等,如性别、年龄、血型、疾病等之间的关系研究等。
下面,我们详细介绍两样本的四格表卡方检验的基本原理、适用条件及其在SPSS中的操作步骤。
视频课程:
四格表的基本形式如下图所示:
以上四格表资料中,abcd这4个数是该表的基本数据,其余结果可由这4个基本数据推算出来。
二、基本假设
H:π=π;
H:π≠π。α=0.05
卡方检验的原假设为组1的样本总体率或构成比与组2的样本总体率或构成比相等,若P<0.05,则拒绝原假设H,接受H,认为两样本的总体率或构成比不相等或存在差异。
三、需要满足的条件
四格表卡方检验要求样本量要大于40且格子中的四个格子理论频数不应小于5。当样本含量大于40但有1≤理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
四、案例解读
现欲比较试验组(药物A)和对照组(药物B)对于维持人体正常血压值的疗效,总共180人,随机分为两组。得到药物结果数据如下:
(1)在SPSS中录入数据
①打开SPSS,将以上四格表的数据输入到软件中。包括有组别和有效性条件列以及频数列,其中,组别(1=试验组;2=对照组),有效性(0=无效;1=有效)。
由于四格表数据在SPSS只有频数信息,需要先对频数进行加权,将数据还原成原始样本信息,才能进行卡方检验的操作。
(2)数据加权还原的操作
①依次点击“数据——加权个案”。
②在“加权个案”窗口中,将“频数”选入右侧“加权个案”的框中,点击“确定”,即完成对样本数据的还原。注:加权操作之后,在“数据视图”上并无加权后的数据显示,但在进行卡方分析时,可以发现数据样本已进行了还原。数据还原完成后,即可以开始进行卡方检验操作。
(3)卡方检验的操作
①依次点击“分析——描述统计——交叉表格”。
②在“交叉表格”窗口中,将“组别”属性选入行中,“有效性”属性选入列中,并点击“statistics(统计)”。
(点击图片查看大图)
③在出现的“统计窗口”,勾选“卡方”。
④点击“继续”,然后“确定”,得到结果如下:
(4)结果解读
①首先,根据得到的三个表,主要查看“卡方检验”表,读取“皮尔逊卡方”值为4.620,对应的显著性值P=0.032<0.05,即拒绝原假设,说明原假设试验组与对照组的有效率不相等。
②其次,可以计算两组的有效率,试验组有效率=97/102=95.10%,对照组有效率=67/78=85.90%,说明试验组药物A的有效率高于对照组药物B的有效率。
五、小结
本文对四格表对照试验的频数资料先在SPSS中进行了数据还原,展示了卡方检验在SPSS中的详细操作步骤。需要注意的是,四格表内频数的大小和总样本量的大小不同,会直接影响到不同卡方检验方法的采用。后期我们会陆续更新更多数据统计分析教程及案例,感谢大家观看!
我们历时两年,精心打造的《SPSS零基础系统实操课程(含答疑,终身更新)》,将10年的SPSS数据统计分析经验浓缩成74节课程,200多页的实操讲义及配套数据,并终身更新(含配套数据、SCI格式的数据分析报告讲义模板)!且课程由陈老师提供,带大家手把手操作SPSS,着力提升SPSS数据分析五大能力。内卷的同学学习后几经成功发论文!
我的《meta分析系统教程》(终身更新)中有全方位的各大中英文数据库文献检索与文献管理,以及全实操meta分析实战案例演示哦!小白一个月即可上手发meta期刊!并且,课程随各大中英文数据库、以及meta分析软件版本更新进行终身更新,并终身更新meta分析案例哦!
下方是我B站的新课,需要的小伙伴可以看看哦!