Seaborn核密度估计


核密度估计(KDE)是一种估计连续随机变量的概率密度函数的方法。它用于非参数分析。

distplot 中将 hist 标志设置为False 将产生核密度估计图。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

输出

图形

拟合参数分布

distplot() 用于可视化数据集的参数分布。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

输出

直方图

绘制双变量分布

双变量分布用于确定两个变量之间的关系。这主要涉及两个变量之间的关系以及一个变量相对于另一个变量的行为。

分析seaborn中双变量分布的最佳方法是使用 jointplot() 函数。

Jointplot创建了一个多面板图形,用于投影两个变量之间的双变量关系,以及每个变量在不同轴上的单变量分布。

散点图

散点图是可视化分布的最方便的方式,其中每个观察通过x和y轴在二维图中表示。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

输出

条形图和直方图

上图显示了Iris数据中 petal_lengthpetal_width 之间的关系。该图中的趋势表明,研究中的变量之间存在正相关。

Hexbin Plot

当数据密度稀疏时,即当数据非常分散且难以通过散点图分析时,六边形分箱用于双变量数据分析。

名为“kind”和值“hex”的附加参数绘制了hexbin图。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

HExagon和酒吧

核密度估计

核密度估计是估计变量分布的非参数方法。在seaborn中,我们可以使用 jointplot() 绘制kde

将值'kde'传递给参数种类以绘制核图。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

输出

X射线