我需要一种算法来确定句子,段落或文章的语气是负面还是正面…或者更好的是负面还是正面。
例如:
杰森(Jason)是我见过的最糟糕的SO用户(-10) Jason是SO用户(0) Jason是我见过的最好的SO用户(+10) 杰森(Jason)最擅长吸吮SO(-10) 在SO方面,Jason做得不好时表现最差(+10)
杰森(Jason)是我见过的最糟糕的SO用户(-10)
Jason是SO用户(0)
Jason是我见过的最好的SO用户(+10)
杰森(Jason)最擅长吸吮SO(-10)
在SO方面,Jason做得不好时表现最差(+10)
不容易吧?:)
我不希望有人向我解释这种算法,但是我认为学术界某处已经有很多此类工作。如果您能指出一些文章或研究,我会喜欢的。
谢谢。
有一个自然语言处理的子领域,称为情感分析,专门处理此问题域。由于在在线用户论坛(ugc或用户生成的内容)中对消费产品进行了如此多的审查,因此该地区进行了大量的商业工作。谢菲尔德大学还有一个用于文本分析的原型平台GATE,以及一个名为nltk的python项目。两者都被认为是灵活的,但性能不是很高。一种或另一种可能会有助于您制定自己的想法。