我有一个包含四列的DataFrame。我想将此DataFrame转换为python字典。我希望第一列keys的元素为,同一行中其他列的元素为values。
DataFrame
keys
values
数据框:
ID A B C 0 p 1 3 2 1 q 4 3 2 2 r 4 0 9
输出应如下所示:
字典:
{'p': [1,3,2], 'q': [4,3,2], 'r': [4,0,9]}
该to_dict()方法将列名设置为字典键,因此你需要稍微调整DataFrame的形状。将“ ID”列设置为索引,然后转置DataFrame是实现此目的的一种方法。
to_dict()
to_dict()还接受一个“东方”参数,你需要该参数才能为每列输出值列表。否则,{index: value}将为每一列返回形式的字典。
{index: value}
这些步骤可以通过以下行完成:
>>> df.set_index('ID').T.to_dict('list') {'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}
如果需要不同的字典格式,以下是可能的Orient参数的示例。考虑以下简单的DataFrame:
>>> df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]}) >>> df a b 0 red 0.500 1 yellow 0.250 2 blue 0.125
然后,选项如下。
dict-默认值:列名称是键,值是index:data对的字典
>>> df.to_dict('dict') {'a': {0: 'red', 1: 'yellow', 2: 'blue'}, 'b': {0: 0.5, 1: 0.25, 2: 0.125}}
list-键是列名,值是列数据的列表
>>> df.to_dict('list') {'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]}
系列 -类似于“列表”,但值是系列
>>> df.to_dict('series') {'a': 0 red 1 yellow 2 blue Name: a, dtype: object, 'b': 0 0.500 1 0.250 2 0.125 Name: b, dtype: float64}
split-将列/数据/索引拆分为键,其值分别是列名,按行和索引标签的数据值
>>> df.to_dict('split') {'columns': ['a', 'b'], 'data': [['red', 0.5], ['yellow', 0.25], ['blue', 0.125]], 'index': [0, 1, 2]}
记录 -每行成为一个字典,其中键是列名,值是单元格中的数据
>>> df.to_dict('records') [{'a': 'red', 'b': 0.5}, {'a': 'yellow', 'b': 0.25}, {'a': 'blue', 'b': 0.125}]
索引 -类似于“记录”,但是字典的字典以键作为索引标签(而不是列表)
>>> df.to_dict('index') {0: {'a': 'red', 'b': 0.5}, 1: {'a': 'yellow', 'b': 0.25}, 2: {'a': 'blue', 'b': 0.125}}