Python 测量差异 Python测量中心趋势 Python正态分布 在统计中,方差是衡量数据集中的值与平均值相差多少的指标。换句话说,它表示值的分散程度。它通过使用标准偏差来衡量。另一种常用的方法是偏斜。 这两个都是通过使用pandas库中可用的函数来计算的。 测量标准偏差 标准偏差是方差的平方根。方差是数据集中平均值与平均值的平方差。在python中,我们使用pandas库中的函数std()来计算这个值。 import pandas as pd #Create a Dictionary of series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack', 'Lee','Chanchal','Gasper','Naviya','Andres']), 'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])} #Create a DataFrame df = pd.DataFrame(d) # Calculate the standard deviation print df.std() 其 输出 如下 - Age 7.265527 Rating 0.661628 dtype: float64 测量偏斜度 它用于确定数据是对称的还是倾斜的。如果索引在-1和1之间,则分布是对称的。如果指数不超过-1,那么它向左倾斜,如果它至少为1,那么它向右偏斜 import pandas as pd #Create a Dictionary of series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack', 'Lee','Chanchal','Gasper','Naviya','Andres']), 'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])} #Create a DataFrame df = pd.DataFrame(d) print df.skew() 其 输出 如下 - Age 1.443490 Rating -0.153629 dtype: float64 因此,年龄分布是对称的,而年龄分布则偏向右侧。 Python测量中心趋势 Python正态分布