我有一个数据集,使用两个不同的聚类算法进行了聚类。结果大致相同,但是群集编号是置换的。现在,为了显示颜色编码的标签,我希望标签ID对于相同的群集是相同的。如何获得两个标签ID之间的正确排列?
我可以使用蛮力来做到这一点,但也许有更好/更快的方法。我将不胜感激任何帮助或指针。如果可能的话,我正在寻找一个python函数。
寻找最佳匹配的最著名的算法是 匈牙利方法 。
由于无法用几句话来解释它,因此我必须向您推荐您选择的书,或Wikipedia文章“匈牙利算法”。
您只需选择对应矩阵的最大值,然后删除该行和列,就可能获得良好的结果(即使差异确实很小,即使是完美的)。