如何在列表中找到重复项并使用它们创建另一个列表？

小编典典

如何在列表中找到重复项并使用它们创建另一个列表？

all

如何在 Python 列表中找到重复项并创建另一个重复项列表？该列表仅包含整数。

阅读 102

2022-03-07

共1个答案

小编典典

要删除重复项，请使用set(a). 要打印重复项，例如：

a = [1,2,3,2,1,5,6,5,5,5]

import collections
print([item for item, count in collections.Counter(a).items() if count > 1])

## [1, 2, 5]

请注意，这Counter不是特别有效并且可能在这里过度杀伤。set会表现更好。此代码按源顺序计算唯一元素列表：

seen = set()
uniq = []
for x in a:
    if x not in seen:
        uniq.append(x)
        seen.add(x)

或者，更简洁地说：

seen = set()
uniq = [x for x in a if x not in seen and not seen.add(x)]

我不推荐后一种风格，因为它在not seen.add(x)做什么并不明显（setadd()方法总是返回None，因此需要not）。

要计算没有库的重复元素列表：

seen = set()
dupes = []

for x in a:
    if x in seen:
        dupes.append(x)
    else:
        seen.add(x)

或者，更简洁地说：

seen = set()
dupes = [x for x in a if x in seen or seen.add(x)]

如果列表元素不可散列，则不能使用集合/字典，而必须求助于二次时间解决方案（将每个元素与每个元素进行比较）。例如：

a = [[1], [2], [3], [1], [5], [3]]

no_dupes = [x for n, x in enumerate(a) if x not in a[:n]]
print no_dupes # [[1], [2], [3], [5]]

dupes = [x for n, x in enumerate(a) if x in a[:n]]
print dupes # [[1], [3]]

2022-03-07