我希望我用正确的措辞来表达我的期望。
我需要比较两段文字。如果两个字符串相同,则我希望得到非常相似的分数,如果字符串非常不同,我需要的分数也将非常不同。
如果我将电子邮件的md5哈希值更改为一个字符,则哈希值会发生急剧变化,我希望某些内容不要过多更改。我需要比较两个内容在没有存储字符串的情况下的相似程度。
更新 :我现在正在考虑结合人们提供的各种链接中的一些想法。理想情况下,我希望使用单个输入函数来创建我的乐谱,因此我正在寻找使用参考字符串来始终将输入与之进行比较。我也正在考虑采用asci字符并进行总结。仍在阅读所有提供的链接。
您正在寻找的是LCS算法(另请参见Levenshtein distance)。您也可以尝试Soundex或其他一些语音算法。