我知道这个问题有很多主题,但是没有一种方法适合我,因此我将发布有关我的具体情况的信息
我有一个看起来像这样的数据框:
data = pd.DataFrame([[1,0],[0,1],[1,0],[0,1]], columns=["sex", "split"]) data['sex'].replace(0, 'Female') data['sex'].replace(1, 'Male') data
我想做的是将“性别”列中的全0替换为“女”,并将所有1替换为“男”,但是当我使用上面的代码时,数据框中的值似乎没有变化
我是否使用了replace()错误?还是有更好的方法进行条件值替换?
是的,您使用的是错误的,Series.replace()默认情况下不是就地操作,它会返回替换的数据框/系列,您需要将其分配回数据框/系列以使其生效。或者,如果你需要就地做到这一点,你需要指定inplace关键字参数的True例子-
Series.replace()
inplace
True
data['sex'].replace(0, 'Female',inplace=True) data['sex'].replace(1, 'Male',inplace=True)
另外,您也可以将上面的参数和arguments一起用于单个replace函数调用中,示例-list``to_replace``value
replace
list``to_replace``value
data['sex'].replace([0,1],['Female','Male'],inplace=True)
示例/演示-
In [10]: data = pd.DataFrame([[1,0],[0,1],[1,0],[0,1]], columns=["sex", "split"]) In [11]: data['sex'].replace([0,1],['Female','Male'],inplace=True) In [12]: data Out[12]: sex split 0 Male 0 1 Female 1 2 Male 0 3 Female 1
您还可以使用字典,例如-
In [15]: data = pd.DataFrame([[1,0],[0,1],[1,0],[0,1]], columns=["sex", "split"]) In [16]: data['sex'].replace({0:'Female',1:'Male'},inplace=True) In [17]: data Out[17]: sex split 0 Male 0 1 Female 1 2 Male 0 3 Female 1