在Python pandas中,最接近R因子的变量是什么?
这个问题似乎是一年前的事了,但是由于它仍然是公开的,所以这里有一个更新。pandas引入了categoricaldtype,其操作与factorsR中的非常相似。请参见此链接以获取更多信息:
categorical
factors
http://pandas-docs.github.io/pandas-docs- travis/categorical.html
从上面的链接中复制一个片段,该片段显示了如何在熊猫中创建“ factor”变量。
In [1]: s = Series(["a","b","c","a"], dtype="category") In [2]: s Out[2]: 0 a 1 b 2 c 3 a dtype: category Categories (3, object): [a < b < c]