我被要求编写一种算法来检测讽刺,但我在逻辑上遇到了一个缺陷(或一个缺陷)。
例如,如果一个人说
答:我爱贾斯汀·贝伯。你喜欢他吗? B:是的。当然。 我绝对爱他。
答:我爱贾斯汀·贝伯。你喜欢他吗?
B:是的。当然。 我绝对爱他。
现在,这可以被认为是讽刺与否,而唯一的了解方法似乎是知道B是否严重。
(我本不应该深入探讨。我们得到了一堆短语,只是被告知如果这些短语在句子中,那么这是讽刺的,但我有兴趣吗?)
有什么办法可以解决此问题?还是在讽刺时计算机绝对卡住了?
(我想这取决于扬声器的音调,但我的输入是文字)
看起来有些研究只是尝试了这一点,但是他们还没有想出一种行之有效的算法。
来自González- Ibáñez的R.等人。“在Twitter中识别讽刺:近距离观察”
讽刺和讽刺是在语言学,心理学和认知科学中经过充分研究的现象。但是在文本挖掘文献中,讽刺讽刺的自动检测被认为是一个困难的问题,仅在少数研究中得到了解决。[…]与我们最密切相关的工作是Davidov等人的工作。(2010年),其目的是在Twitter和亚马逊产品评论中识别讽刺和非讽刺话语。在本文中,我们考虑了区分讽刺性推文和非讽刺性推文的难题。
他们得出结论:
也许不足为奇的是,人类判断力和机器学习技术都没有表现出色。[…]我们的结果表明,仅词汇特征不足以识别讽刺,而且务实和上下文特征值得进一步研究
这是另一篇近期相关的论文: Reyes,A.“从幽默识别到讽刺发现:社交媒体的调动语言”