小编典典

如何将pandas数据框的数据类型更改为具有定义格式的字符串?

python

我开始用这个来扯头发-所以我希望有人可以帮忙。我有一个使用openpyxl从Excel电子表格创建的pandas
DataFrame。产生的DataFrame看起来像:

print image_name_data
     id           image_name
0  1001  1001_mar2014_report
1  1002  1002_mar2014_report
2  1003  1003_mar2014_report

[3 rows x 2 columns]

…具有以下数据类型:

print image_name_data.dtypes
id            float64
image_name     object
dtype: object

问题是id列中的数字实际上是标识号,我需要将它们视为字符串。我尝试使用以下方法将id列转换为字符串:

image_name_data['id'] = image_name_data['id'].astype('str')

这看起来有点丑陋,但它确实会产生类型为’object’而不是’float64’的变量:

print image_name_data.dyptes
id            object
image_name    object
dtype: object

但是,创建的字符串具有小数点,如下所示:

print image_name_data
       id           image_name
0  1001.0  1001_mar2014_report
1  1002.0  1002_mar2014_report
2  1003.0  1003_mar2014_report

[3 rows x 2 columns]

如何将pandas DataFrame中的float64列转换为给定格式的字符串(在这种情况下,例如’%10.0f’)?


阅读 196

收藏
2021-01-20

共1个答案

小编典典

我无法重现您的问题,但您是否尝试过先将其转换为整数?

image_name_data['id'] = image_name_data['id'].astype(int).astype('str')

然后,关于更一般的问题,您可以使用map。在您的情况下:

image_name_data['id'] = image_name_data['id'].map('{:.0f}'.format)
2021-01-20