我最近参加了一门关于“自然语言处理” 的课程,尽管我很好地理解了这些概念,但实际上并没有任何实践知识,因此我学到了很多有关解析,IR和诸如Q&A等有趣的方面的知识。谁能为我推荐有关自然语言处理的优秀在线教程或书籍?
谢谢
您可以阅读Jurafsky和Martin的语音和语言处理(2008年版),这是该领域的标准教科书。它很长,并且有各种各样的主题,所以我建议您只阅读真正适合您的兴趣的章节。
此外,最好的学习方法几乎是肯定要从头开始实际实现NLP算法。您可以选择一些标准任务(语言建模,文本分类,POS标记,NER,解析),并从头开始实施各种算法(ngram模型,HMM,Naive Bayes,MaxEnt,CKY),以真正了解它们的工作原理。找到一些免费的数据集来测试您的实现也不应该太难。
最后,对于出色的特定NLP算法,还有很多教程。例如,如果您要构建HMM,则建议使用Jason Eisner的教程,该教程还涵盖EM的平滑和无监督训练。如果要在无监督的朴素贝叶斯训练中实施Gibbs采样,建议使用PhilipResnik的教程。