1、假设有两个分类变量X和Y,它们的值域分别为{x1, x2}和{y1, y2},其样本频数列联表为: 若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。
【资料图】
2、 具体的做法是,由表中的数据算出随机变量K^2的值(即K的平方) K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d为样本容量 K^2的值越大,说明“X与Y有关系”成立的可能性越大。
3、 当表中数据a,b,c,d都不小于5时,可以查阅下表来确定结论“X与Y有关系”的可信程度: 例如,当“X与Y有关系”的K^2变量的值为6.109,根据表格,因为5.024≤6.109<6.635,所以“X与Y有关系”成立的概率为1-0.025=0.975,即97.5%。
4、 四格表资料检验: 四格表资料的卡方检验用于进行两个率或两个构成比的比较。
5、 1. 专用公式: 若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d), 自由度v=(行数-1)(列数-1) 2. 应用条件: 要求样本含量应大于40且每个格子中的理论频数不应小于5。
6、当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
7、 行×列表资料检验: 行×列表资料的卡方检验用于多个率或多个构成比的比较。
8、 1. 专用公式: r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1] 2. 应用条件: 要求每个格子中的理论频数T均大于5或1
9、当有T<1或1
10、而多个率的两两比较可采用行X列表分割的办法。
本文为大家分享到这里,希望小伙伴们有帮助。