如果一个单词在英语词典中,我想检查一个 Python 程序。
我相信 nltk wordnet 接口可能是要走的路,但我不知道如何将它用于如此简单的任务。
def is_english_word(word): pass # how to I implement is_english_word? is_english_word(token.lower())
将来,我可能想检查一个单词的单数形式是否在字典中(例如,属性-> 属性-> 英文单词)。我将如何实现这一目标?
为了(更多)功能和灵活性,请使用专用的拼写检查库,例如PyEnchant. 有一个教程,或者你可以直接潜入:
PyEnchant
>>> import enchant >>> d = enchant.Dict("en_US") >>> d.check("Hello") True >>> d.check("Helo") False >>> d.suggest("Helo") ['He lo', 'He-lo', 'Hello', 'Helot', 'Help', 'Halo', 'Hell', 'Held', 'Helm', 'Hero', "He'll"] >>>
PyEnchant附带一些字典(en_GB、en_US、de_DE、fr_FR),但如果您想要更多语言,可以使用任何OpenOffice 的。
似乎有一个名为 的多元化库inflect,但我不知道它是否有任何好处。
inflect