卡方检验
卡方检验的类型
您使用卡方检验来验证关于数据是否符合期望的假设。这种检验背后的基本思路是,将数据中的观测值与原假设为真时的期望值进行比较。
有两种常用的卡方检验:拟合优度卡方检验和独立性卡方检验。这两种检验都涉及到将数据分成不同类别的变量。因此,人们可能会感到困惑,不知该使用哪种检验。下表对这两种检验进行了比较。
访问相应的页面来了解每种类型的卡方检验,并查看示例以及关于假设和计算的详细信息。
表 1:选择卡方检验
拟合优度卡方检验
独立性卡方检验
变量数
ONE
2 个
检验目的
确定一个变量是否可能来自某个给定的分布
确定两个变量是否可能相关
示例
确定糖果包中每种口味糖果数量是否相同
确定电影观众决定购买零食是否与他们打算观看的电影类型相关
示例中的假设
Ho:不同口味糖果的比例相同 Ha:不同口味糖果的比例不同
Ho:购买零食的观众比例与电影类型无关 Ha:购买零食的观众比例与电影类型相关
检验中使用的理论分布
卡方
卡方
自由度
类别数减 1 在我们的示例中,就是糖果的口味数减 1
第一个变量的类别数减 1,乘以第二个变量的类别数减 1 在我们的示例中,就是电影类别数减 1,乘以 1(因为购买零食是“是”/“否”变量,且 2-1 = 1)
如何开展卡方检验?
对于拟合优度卡方检验和独立性卡方检验,您需要执行下列相同的分析步骤。请访问每种检验类型的页面,查看详细操作步骤。
- 在收集数据之前定义原假设和备择假设。
- 确定 alpha 值。这涉及到您愿意为得出错误结论而承担的风险。例如,假设您在检验独立性时设置 α=0.05。这里,您确定了有 5% 的风险会得出错误的结论,即,两个变量实际上是不独立的,但检验得出的结论是独立的。
- 检查数据是否有误。
- 检查关于检验的假设。(请访问每种检验类型的页面,了解关于假设的更多详情。)
- 执行检验并得出结论。
上表中的两种卡方检验都涉及到计算检验统计量。这些检验背后的基本思路是:将实际数值与原假设为真时将会出现的期望值进行比较。检验统计量包括找到实际数据值与期望数据值之间的平方差,然后用这个差值除以期望的数据值。对每个数据点执行此操作并将这些值相加。
然后,将检验统计量与来自卡方分布的理论值进行比较。理论值取决于数据的 alpha 值和自由度。请访问每种检验类型的页面来查看详细示例。