这是我的DataFrame:
d = {'col1': ['sku 1.1', 'sku 1.2', 'sku 1.3'], 'col2': ['9.876.543,21', 654, '321,01']} df = pd.DataFrame(data=d) df col1 col2 0 sku 1.1 9.876.543,21 1 sku 1.2 654 2 sku 1.3 321,01
col2中的数据是本地格式的数字,我想将其转换为:
col2 9876543.21 654 321.01
我尝试过df['col2'] = pd.to_numeric(df['col2'], downcast='float'),它返回ValueError::无法解析位置0处的字符串“ 9.876.543,21”。
df['col2'] = pd.to_numeric(df['col2'], downcast='float')
我也尝试过df = df.apply(lambda x: x.str.replace(',', '.')),它返回ValueError:无法将字符串转换为float:‘5.023.654.46’
df = df.apply(lambda x: x.str.replace(',', '.'))
谢谢你的帮助!
如果可能的话,最好使用read_csv:
read_csv
df = pd.read_csv(file, thousands='.', decimal=',')
如果不可能,那么replace应该有所帮助:
replace
df['col2'] = (df['col2'].replace('\.','', regex=True) .replace(',','.', regex=True) .astype(float))