Pandas怎么可能像
df.merge(df2, left_on='first', right_on='second', how='left')
将数据帧从221309行增加到1388680行?
df 1的形状(221309,83)
df2的形状(7602,6)
正如@JonClements在评论中所说,这是由于用于合并/联接的列中条目重复的结果。这是一个小演示:
In [5]: df Out[5]: a b 0 1 11 1 1 12 2 2 21 In [6]: df2 Out[6]: a c 0 1 111 1 1 112 2 2 221 3 2 222 4 3 311 In [7]: df.merge(df2, on='a', how='left') Out[7]: a b c 0 1 11 111 1 1 11 112 2 1 12 111 3 1 12 112 4 2 21 221 5 2 21 222