展开

Chi-squared tests, Fisher's exact test, Hypergeometric test

最后发布时间 : 2022-08-28 19:55:24 浏览量 :

Pearson's chi-squared test

Pearson's chi-squared test,是最有名的卡方检验,有两种用途,分别是“拟合优度检验”(Goodness of Fit test)以及“独立性检验”。科学文章中,当提到卡方检验而没有特别注明是哪一种时,通常便是指皮尔逊卡方检验。

图片alt

图片alt

Pearson's chi-squared test用于确定列联表的一个或多个类别中的预期频率和观察到的频率之间是否存在统计显着差异。由著名统计学家Karl Pearson提出,广泛应用于分类变量(categorical data)的独立性检验中,也可用于分类变量的比较检验中。

  • 对于分类变量的比较检验,如下例,某种癌症化疗只有两种疗法:单纯化疗和复合化疗,且没有顺序;其疗效只有缓解和未缓解两类,且没有顺序,现要根据样本数据检验这两种化疗疗效有无差异:
  • 图片alt

    图片alt

  • 对于分类变量的独立性检验,如下例,从某总体中经过简单随机抽样获得的频数数据,性别只分男女两类,且没有顺序;研究色盲问题时只有色盲和正常两类,也没有顺序,现要根据样本数据检验色盲与性别是否独立(也即色盲与性别有无关系)
  • 图片alt

    图片alt

The Chi-Square Independence Test是判断两个变量之间是否存在关联的推理方法。与其他假设测试类似,零假设表明两个变量不相关。相反,另一种假设认为这两个变量是相关的。

Fisher's exact test

Fisher精确检验(Fisher exact test)是一个比较另类的检验,它没有统计量,更没有繁琐的统计量的表格,它算出来的就是p值,但是它在大样本情况下手算几乎是不可能的,因为它涉及到阶乘运算

同是固定边际频数不变,与Pearson的思想不同(似乎他俩到后面意见就没怎么相同过),Fisher考虑的是超几何分布:固定边际频数不变后,每次抽样就相当于从边际频数中抽取数字填进四格表中,从而得到样本的情形服从超几何分布:

图片alt

图片alt

Testing Independence: Chi-Squared vs Fisher's Exact Test

https://www.datascienceblog.net/post/statistical_test/contingency_table_tests/

图片alt

图片alt

Chi-square test for variance

方差的卡方检验是一种非参数统计程序,具有卡方分布的测试统计量,用于确定从特定样本获得的变量的方差是否具有与已知的人群方差相同的变量相同的变量

图片alt

图片alt


whereby
n = the sample size
s2 = the sample variance
σ² = the population variance
For the example data, calculating the test statistic produces the following result:
图片alt

图片alt


The chi-square test statistic of the example is 77.22.

参考