小编典典

如何在列表中找到重复项并使用它们创建另一个列表?

all

如何在 Python 列表中找到重复项并创建另一个重复项列表?该列表仅包含整数。


阅读 101

收藏
2022-03-07

共1个答案

小编典典

要删除重复项,请使用set(a). 要打印重复项,例如:

a = [1,2,3,2,1,5,6,5,5,5]

import collections
print([item for item, count in collections.Counter(a).items() if count > 1])

## [1, 2, 5]

请注意,这Counter不是特别有效并且可能在这里过度杀伤。set会表现更好。此代码按源顺序计算唯一元素列表:

seen = set()
uniq = []
for x in a:
    if x not in seen:
        uniq.append(x)
        seen.add(x)

或者,更简洁地说:

seen = set()
uniq = [x for x in a if x not in seen and not seen.add(x)]

我不推荐后一种风格,因为它在not seen.add(x)做什么并不明显(setadd()方法总是返回None,因此需要not)。

要计算没有库的重复元素列表:

seen = set()
dupes = []

for x in a:
    if x in seen:
        dupes.append(x)
    else:
        seen.add(x)

或者,更简洁地说:

seen = set()
dupes = [x for x in a if x in seen or seen.add(x)]

如果列表元素不可散列,则不能使用集合/字典,而必须求助于二​​次时间解决方案(将每个元素与每个元素进行比较)。例如:

a = [[1], [2], [3], [1], [5], [3]]

no_dupes = [x for n, x in enumerate(a) if x not in a[:n]]
print no_dupes # [[1], [2], [3], [5]]

dupes = [x for n, x in enumerate(a) if x in a[:n]]
print dupes # [[1], [3]]
2022-03-07