当前位置：首页 > 科技 > 正文

SPSS 统计分析策略（11）：两组率比较的统计方法?（卡方和Fisher法）

启示号
科技
4天前
2188

第11讲实验性研究分类数据统计策略（1）：

两组率比较的统计方法

系列课程“SPSS教程”1-10讲为实验性定量数据统计分析策略。从第11文开始，介绍实验性分类数据结局的基本统计分析方法。

分类结局包括这两种形式，一种无序分类的结局，一种是有序分类结局。无序分类结局又包括二分类结局和多分类结局。

本文的内容是二分类结局的分析。二分类结局往往以率的形式开展描述，因此统计分析探讨的是率有无差异。

实例分析

吲达帕胺片治疗原发性高血压疗效，将患者随机分为两组。试验组用吲达帕胺片加辅助治疗，对照组用安慰剂加辅助治疗。试分析两组率有无统计学差异？数据详见ht.sav

思考

这个案例需要思考：

-该研究属于何种类型的研究设计？

-结局变量属于什么类型的变量？

-分组数是多少？

-正态性问题如何考虑？

案情分析

本案例结局为疗效为二分类结局。该结局开展描述时计算有效率，比如治疗组有效率、对照组有效率等。分组变量为处理因素，分为2个水平：吲达帕胺片组和安慰剂组。

如此数据，在统计描述上，可以绘制出三线表

该研究核心数据有2行2列（红框内），因此称之为2*2行列表或者交叉表资料。此外，由于红框中的结果在表格中占据4个单元格（a、b、c、d），这样的交叉表资料被俗称为四格表资料。

一般来说，分析四格表资料就等同于分析两个率的差异性。

最后，两组率的差异分析，不考虑正态性问题。

统计分析策略

两个率的差异如何分析呢？基本统计学方法有三类：z检验、卡方检验和Fisher确切概率法。最常见的就是卡方检验（c2检验，Chi-square）和Fisher确切概率法。

卡方检验是统计学奠基人Kar-Pearson百年前提出，其基本理论是比较理论值（期望值）和实际值的吻合程度来探讨不同样本是否来源于同一个总体。具体原理不再赘述。Fisher确切概率法是另外一位统计学奠基人Fisher提出，主要基于二项分布和二项分布函数，计算极端事件发生概率是否属于小概率事件的一种方法。

总结来说，

具体来说，采用卡方检验还是Fisher确切概率法，一般有如下考虑：

1.如果整个研究样本量≥40，四个单元格（a,b,c,d）的理论值T，又称期望值，（expectation）都大于或等于5，则可采用卡方检验进行比较。

n≥40，且T ≥ 5，卡方检验

2.如果整个研究样本量≥40 ，四个单元格（a,b,c,d）的理论值T（期望值，expectation）至少有一个在1-5之间，普通的卡方检验的结果不太可靠，需要对卡方检验方法进行改进，采用校正卡方检验进行比较。

n≥40，且至少一个1≤T <5，校正卡方检验

3.如果整个研究样本量<40，或者四个单元格（a,b,c,d）的理论值T（期望值，expectation）至少小于1，则无论卡方或者校正卡方都不可靠，须采用Fisher确切概率法。

n＜40或至少1个T ＜1 ，Fisher确切概率法

值得注意的是，上述方法均为我国教材流传至今的常规操作。实际工作可便宜行事，具体可见最后的讨论。

如何利用SPSS进行卡方和Fisher确切法检验

卡方和Fisher检验入口界面

分析-描述统计-交叉表

卡方和Fisher检验检验对话框

在“交叉表”对话框中，分别选择分组变量和结局变量到“行”和“列”中。

①、②：行”和“列”分别放哪个变量没有规定，结果是一致的（分组变量可以放“行”，也可以放“列”中）。一般建议与最后论文报告中的行列方向一致。

③精确：点击选择“精确”选项，进行Fisher检验

④统计：选择“卡方”，进行卡方检验

⑤单元格：可进行计算①实际频数（必选）和期望频数（可选，不建议选择），②选择计算百分比中的行与列，不必同时选择，选择一项即可，一般和交叉表的分组变量的放入行”“列”位置一致。

统计分析结果与解释

结果主要为2张表格。

第1表：分组统计描述结果，分别给出试验组和对照组的各自的结局，包括发生数以及相应的百分比。

第2表：卡方和Fisher确切检验的结果。该结果同时展示了卡方、校正卡方、和Fisher确切概率分析结果，也显示了总样本量、理论（期望）频数的情况。

阅读表格，首先要关注总样本量和理论（期望）频数。总样本量在表格最后一行①：有效个案数。需要关注是否≥40。理论（期望）频数在表格下方第一个注释a②。注释前半句说的是多少单元格期望数小于5，这半句将决定是否采用卡方检验；后半句指出最小期望数，将决定是否采用Fisher法。

卡方检验，当n≥40，且T ≥ 5，选择第一行的“皮尔逊卡方”①，卡方值②，选择P值（渐进显著性双侧）③。

校正卡方检验，n≥40，且至少一个1≤T <5，选择第二行“连续性修正”①，

，卡方值②，选择P值（渐进显著性双侧）③。

Fisher确切概率法，n＜40或至少1个T ＜1 ，选择第四行的“费希尔精确检验”①，选择值（精确显著性双侧）②。

对于本例，样本量70，0单元格（0%）期望计数小5，最小为10.77，应选择一般的卡方检验，卡方值8.399，P=0.004。两组人群的有效率存在着统计学差异。

结果及表格的规范表达

根据统计分析可以得到以下的规范的结果：
规范文字：吲达帕胺片组有效率80.77%，安慰剂组有效率45.45%，两组有效率存在着统计学差异（差值0.35，差值这95%CI0.14-0.56，P=0.004）。

规范的统计表（其中一种形式）为：

提醒：和均数一样，率也建议计算置信区间。怎么计算？系列文章将很快推出！

拓展知识

1. 两组率的比较方法，基于Poisson 分布检验了解下？

除了本文介绍的常规二分类结局，有些医学研究的结局是罕见事件的结局（肿瘤的发病、出生缺陷发生率等）。例如，开展以下两个率的比较，试验组和对照组发生率分别为6.7/10万，5.0 /十万。

二分类数据中，阳性事件数的分布属于二项分布，而当率非常低时，阳性事件数（例如本例的发生数）分布可视为另一个特殊的分布：泊松（Poisson）分布。

泊松分布数据的比较有相应的检验方法，但SPSS软件不好实现，可通过R语言快速实现假设检验，这里展示一下R语言程序和结果

①R语言程序

poisson.test(c(30,10), c(300000,200000),

alternative = c("two.sided"),

conf.level = 0.95)

②R语言分析结果。

2.Fisher方法不是两个率比较的辅助方法

上文写到，Fisher方法应用条件是n＜40或至少1个T ＜1 。实际上，这一条件可以放宽。理论上，Fisher方法可以使用在所有分类数据的比较上，当然也包括四格表资料，而且它的结果更为精确。所以不要觉得Fisher是配角，Fisher使用没有条件限制。

那为什么一直以来卡方检验更常见而不是Fisher法呢？部分原因是计算能力的问题，Fisher对计算机的性能要求较高。Fisher很难人工进行运算，或者早些年在计算机运算能力较弱的时，Fisher法会卡壳！而卡方就没有这个问题，而且大样本时卡方检验结果和Fisher几乎一致。所以，之前教材一直推崇卡方而不是Fisher。现在情况不同了，一般软件都能应付大部分的Fisher检验。所以不要被“n＜40或至少1个T ＜1”条件限制，不要觉得达不到这个条件Fisher结果不正确。比如一篇小样本研究的论文，按照四格表统计分析的条件，有一些需要卡方、有一些需要校正卡方、有一些是Fisher法，为了统一，全部用Fisher方法，也没有任何问题的，只要SPSS能够给出Fisher的结果。

特别是，当卡方检验P值在0.05附近时，更推荐Fisher法。因为Fisher结果更精确，它能够真正判断一项研究P值到底>0.05，还是<0.05。总结起来，卡方受条件限制，而Fisher不受数据限制，只受计算机运算能力限制，很多时候，Fisher方法可以成为主角。

SPSS 课程视频和操作录屏

SPSS课程视频

带字幕去水印的视频可复制以下地址浏览器打开
https://evod.zcmu.edu.cn/resource.html?stationID=1&resourceid=429&isprivate=false&cateid=102

SPSS课程录屏

-本讲结束-

SPSS教程(点击相应链接学习)

3. 正态性检验（、SPSS简版、）

4. 两样本t检验（、、）

5.两样本秩和检验（、、）

6. 多样本F检验（、）

7. 多重比较（SPSS详版、SPSS简版、R语言版）

8. 随机区组方差分析（）

9.小统计大文章（上）（）

10.小统计大文章（下）（）

课程资料包括视频、讲义、练习数据集、R语言代码可通过关注公众号，发送关键词“SPSS”至公众号，即可获得免费下载。课程资料将随文章同期更新

本公众号在传播统计学知识的同时，也放置了一些常用的资源来方便大家科研。所有资源全部免费下载，有兴趣的朋友可以关注下载。

。

10.

你可能想看：

30天打卡学习医学统计与SPSS（Day 10）：两组率比较的统计方法

讲述基于不同医学研究类型的各种统计分析策略。诸位可以结合视频、SPSS操作录屏、文字版教程进行学习，两组率比较的统计方法，实验性研究定性数据的统计分析策略，系列课程前面2-9日为实验性定量数据统计分析...

SpringBoot报错 Error parsing HTTP request header

Note:Note:at org.apache.coyote.http11.AbstractNioInputBuffer.parseRequestLine(AbstractNioInputBuffer...

'相似三角形'几何证明问题中关于比例线段的分析策略探究

有关的几何证明问题首先要熟悉“从复杂图形中分离出基本图形”证明中关于比例线段的一般分析途径，分析条件所给比例线段！注意到CF与AF是同一直线上有共同端点的两条线段:欲证△DFC∽△AED，∠DFC=∠...

工具｜聊一聊记账从「钱迹」转移至 Google sheets 的心历路程

但我印象中第一次接触记账还真的是用小本本来——这就要说起八年前广东那个风雨交加的夜晚了......当时在那边做暑假工？对于软件记账来说就完全没有以上劣势，我会比较偏爱独立开发者做出的产品，这就涉及到了...

Pain in the ass可不是“屁股痛”，理解错就尴尬了

是一个特别常用的表达，这个表达的真实含义跟屁股真的没有关系哦，我们就可以使用这个表达，我知道该更新驾照了，这个新型冠状病毒真是令人讨厌，在美剧《生活大爆炸》里面：Penny评价Sheldon时:就用到...

Cell Reseach：caspase11切割gasderminD引发“细胞焦亡” - 基因编辑专区 - 生物谷

这些炎性caspase的激活能够促进细胞焦亡事件的发生，炎性caspase究竟是如何调节这些细胞事件至今仍然有待解决。该蛋白的切割能够引发细胞焦亡事件的发生。他们发现这一突变体小鼠不能够正常发生细胞焦...

rancher从阿里云拉取镜像并部署

并将镜像上传到阿里云的容器镜像服务中，1、指定镜像库如果你在阿里云容器镜像中心的服务是私有的“'镜像库'中配置对应镜像库信息，一个应用里可以存放一种类型的多个服务，因此我们需要新建应用来管理服务，这里...

LPA（Limited Partnership Agreement),私募基金设立的核心文件

是用来约束全体合伙人的核心法律文件，这个文件里约束了LP和GP的权利与义务，对于有限合伙来说LPA是最核心和最基础的文件,GP充当的是私募基金管理人的角色。一般来说GP会去寻找投资机会然后去进行服务管...

What Makes Hero

Ronan,Only the sense of responsibility is the decisive factor in making people a hero. Based on resp...

使用Xmanager远程桌面连接到RHEL6.3服务器

听说有工具可以像windows的远程桌面一样来登录到linux远端X窗口，确保在Linux服务器上能图形界面登录系统：（x.x.x.x为需要显示图形界面的windows计算机IP地址） 3、防火墙设置...

谷歌相机完整的 LibPatcher BSG

非常低的值会使图像变得柔和而没有结构和绘画，我没有注意到清晰度或结构的显着提高，较小的值往往具有更积极的降噪效果。最小值或较小的值会导致颜色泄漏，高值不会增加照片的亮度。唯一改变图像结构的功能是非常轻...

学习制作PAL的launcher.ini文件（四）

在启动程序的配置文件launcher.ini中，[Activate]Registry=true[RegistryKeys]区段处理使用便携软件时产生的注册表键，1、使用便携软件后删除所产生的注册表键，...

场地空间尺度的水体生态设计分析

本文从场地空间尺度的水体生态设计入手，分析和总结了水体生态设计中水体天然循环、水体平面形态、水体生态驳岸、水体深度、水生植物的生态设计技术手法，论述其水体生态设计各要素的准确性：需要从水体的天然循环、...

VBA遍历所有文件夹的两种方法（filesearch和FileSystemObject）

另外一种是使用FileSystemObject(windows文件管理工具)和递归方法。

【PS教程】PS怎么自制电子版一寸、两寸照片

PS怎么自制电子版一寸、两寸照片　　电子照片是现在最常用的照片?但是你知道怎么制作电子版一寸、两寸照片吗，今天小编就为大家介绍自制电子版一寸、两寸照片教程：PS怎么自制电子版一寸、两寸照片文章链接，Z...

隐蔽工程审计的必要性及审计方法

而隐蔽工程审计则是整个工程项目审计的重点和难点。审计人员很少常驻工地对施工过程进行现场实时监督。相对于隐蔽工程的审计具有一定滞后性。隐蔽工程的审计是确保工程质量和有效控制工程造价的重要手段。介绍如下隐...

VFP与SQL Server的连接

本文主要讲解VFP到SQL Server的连接以及连接中应该注意的问题和错误的解决方法　　这里所指的连接关系（connection）指的是当VFP通过界面卡、SQL Server 的网络架构、传输媒...

SEER数据库系列|SEER数据库基本介绍

美国国家癌症研究所（National Cancer Institute）的SEER数据库收集了大约30％的美国人口的癌症诊断。从简单地按人群中器官部位枚举癌症的发展到包括通过组织病理学和分子亚型（由驱...

总结了484个以er为后缀的单词得出四种加后缀er规则

er▬▶英 [ɜː(r)]美[ɜːr]▬▶int.(思索该说什么话时发出的声音)哦，1）abetter▬▶英[ə'betə]美[ə'betə]▬▶abet（v.教唆;rə]美[əb'hɒrə]▬▶ab...

Imperial Blue威士忌是一种什么样的酒？品鉴Imperial Blue威士忌

是印度最受欢迎和标志性的威士忌品牌之一，它融合了进口苏格兰威士忌和精致的印度谷物烈酒。并在市场上取得了令人瞩目的进展。迅速成为该领域的领先威士忌品牌之一，该品牌不仅是最着名的印度威士忌品牌之一，使其成...

反比例函数问题中“斜化正策略”与“方程策略”

反比例函数问题中“一是求反比例函数的解析式时，知道反比例函数图像上任意一点的坐标；即可将运用纵横坐标乘积迅速求出解析式，得出过反比例函数图像上任意一点向x轴和y轴做垂线“构成的坐标矩形的面积等于|k|...

TCGA甲基化分析工具-MEXPRESS

今天再来给大家介绍一个研究TCGA的DNA甲基化与表达数据的工具——MEXPRESS，癌基因的DNA甲基化水平降低或者抑癌基因的DNA甲基化水平增高都可能会导致肿瘤的发生，工具的使用只需输入基因名+选...

D-二聚体和FDP的联合检测及临床意义

D-二聚体和FDP的检测对于诊治凝血-纤溶系统疾病、溶血栓治疗的监测等方面有着重要的意义。DVT和PTE是同一疾病静脉血栓（VTE）在不同脏器中的表现，D-二聚体和FDP检测对VTE的价值在于较高的阴...

先验和经验的统一

先验知识讨论的是知识的先天形式。认为数学的和推理的逻辑过程是不依赖经验不受经验影响的，这样的推理显然是根据地球上的经验观察的归纳抽象为前提的？先天形式和后天经验是构成知识的根本要素，先验知识所讨论的不...

ISPE 调试与确认（第二版）的风险评估实施方法直播回顾及问答

通过系统风险评估代替了第一版的部件关键性评估，依据系统是否影响产品关键质量属性或关键公用系统提供的产品质量来分类为直接影响系统和非直接影响系统：直接影响系统需要开展调试与确认工作，系统风险评估用来检查...

学生信息道德培养活动设计方案

为此我校开展信息道德教育活动，广泛宣传国家互联网管理使用及网络安全等法律法规，引导学生运用信息知识解决信息问题，自觉抵制网络不良信息。信息能力是指运用信息知识，技术和工具解决信息问题的能力，它包括信息...

Fisher 卡方检验方法数据

上一篇
三星的计中计与局中局

下一篇
抱歉，穷人的社交毫无价值

SPSS 统计分析策略（11）：两组率比较的统计方法?（卡方和Fisher法）

最新文章

8769.cm资料图库

易语言远程控制源码吾爱破解（易语言远控带ddos源码）

8769的资料49图49图库

深度思考的魅力

临证小个案（左侧背痛、偏头痛）--血府逐瘀汤

口碑好的国产车有哪些 10万左右口碑最好的国产

沙拉才是夏天餐桌上的女王

正版资料全年资料4949图库

热门文章

欣赏丨世界著名的60幅女人体油画，裸露但不低俗~

小六壬完整解释

小六壬神断口诀大全，掐指一算直断生死！

荨麻疹图片和症状：手脸脖子荨麻疹初期症状图片大全

亲戚关系图（关于中国亲戚称谓）家庭称谓大全，再也不用担心叫错了称呼

珍贵舌诊：脾肾阳虚、虚寒泄泻、胃阴虚的舌苔照，看完记得存！

倪海厦经典配方全集（六）——桂枝汤、大小青龙汤、五苓散等

“四川泸州油纸伞” 的第七代传承人余万伦古法制伞一辈子