标记系统中需要茎提取。我使用美味,没有时间来管理和修剪标签。我对自己的博客更加谨慎,但这并不完美。我为嵌入式系统编写软件,如果包含阻止功能,它们将具有更多功能(对用户有帮助)。
例如: 解析 解析器 解析
无论我将它们放入什么系统,所有这些都应该具有相同的含义。
理想情况下,某个地方有获得BSD许可的词干提取器,但是如果没有,我应该在哪里学习这种方法的常用算法和技术?
除了BSD词干分析器外,还有哪些其他开源许可的词干分析器?
-亚当
Snowball stemmer(C和Java)我用过的是Python绑定,PyStemmer