我有一个四列的 DataFrame。我想将此 DataFrame 转换为 python 字典。我希望第一列keys的元素 be 和同一行中其他列的元素 be values。
keys
values
数据框:
ID A B C 0 p 1 3 2 1 q 4 3 2 2 r 4 0 9
输出应该是这样的:
字典:
{'p': [1,3,2], 'q': [4,3,2], 'r': [4,0,9]}
该to_dict()方法将列名设置为字典键,因此您需要稍微重塑 DataFrame。将“ID”列设置为索引,然后转置 DataFrame 是实现此目的的一种方法。
to_dict()
to_dict()还接受您需要的“orient”参数,以便为每列输出值 列表 。{index: value}否则,将为每一列返回表单的字典。
{index: value}
这些步骤可以通过以下行来完成:
>>> df.set_index('ID').T.to_dict('list') {'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}
如果需要不同的字典格式,这里是可能的 orient 参数的示例。考虑以下简单的 DataFrame:
>>> df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]}) >>> df a b 0 red 0.500 1 yellow 0.250 2 blue 0.125
那么选项如下。
dict - 默认值:列名是键,值是索引的字典:数据对
>>> df.to_dict('dict') {'a': {0: 'red', 1: 'yellow', 2: 'blue'}, 'b': {0: 0.5, 1: 0.25, 2: 0.125}}
list - 键是列名,值是列数据列表
>>> df.to_dict('list') {'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]}
系列 - 类似于“列表”,但值是系列
>>> df.to_dict('series') {'a': 0 red 1 yellow 2 blue Name: a, dtype: object, 'b': 0 0.500 1 0.250 2 0.125 Name: b, dtype: float64}
split - 将列/数据/索引拆分为键,值是列名,数据值分别是行和索引标签
>>> df.to_dict('split') {'columns': ['a', 'b'], 'data': [['red', 0.5], ['yellow', 0.25], ['blue', 0.125]], 'index': [0, 1, 2]}
记录 - 每一行都成为一个字典,其中键是列名,值是单元格中的数据
>>> df.to_dict('records') [{'a': 'red', 'b': 0.5}, {'a': 'yellow', 'b': 0.25}, {'a': 'blue', 'b': 0.125}]
index - 类似“records”,但是一个以键为索引标签的字典字典(而不是列表)
>>> df.to_dict('index') {0: {'a': 'red', 'b': 0.5}, 1: {'a': 'yellow', 'b': 0.25}, 2: {'a': 'blue', 'b': 0.125}}