Python卡方检验


卡方检验是确定两个分类变量是否具有显着相关性的统计方法。这两个变量应该来自相同的人口,他们应该是类似的 - 是/否,男/女,红/绿等。例如,我们可以建立一个数据集,观察人们的冰淇淋购买模式并尝试关联具有他们喜欢的冰淇淋味道的人的性别。如果发现相关性,我们可以通过了解访问人群的性别数量来计划适当的口味。

我们在numpy库中使用各种功能来执行卡方检验。

from scipy import stats
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 10, 100)
fig,ax = plt.subplots(1,1)

linestyles = [':', '--', '-.', '-']
deg_of_freedom = [1, 4, 7, 6]
for df, ls in zip(deg_of_freedom, linestyles):
  ax.plot(x, stats.chi2.pdf(x, df), linestyle=ls)

plt.xlim(0, 10)
plt.ylim(0, 0.4)

plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Chi-Square Distribution')

plt.legend()
plt.show()

输出 如下 -

chisquare.png