我想找到两个字符串之间的字符串相似性。此页面包含其中一些示例。Python具有Levenshtein算法的实现。在这些约束下是否有更好的算法(最好是python库)。
对于我的情况,除Levenshtein距离(或Levenshtein比率)以外的其他算法是否会更好?
谢菲尔德大学有大量的字符串相似性指标资源。它具有各种指标列表(仅包括Levenshtein),并且具有这些指标的开源实现。看起来其中许多应该很容易适应Python。
http://web.archive.org/web/20081224234350/http://www.dcs.shef.ac.uk/~sam/stringmetrics.html
以下是一些清单: