一种算法可以检测出讽刺吗?
nlp
5
0

我被要求编写一种算法来检测讽刺,但我在逻辑上遇到了一个缺陷(或一个缺陷)。

例如,如果一个人说

答:我爱贾斯汀·贝伯。你喜欢他吗?

B:是的。当然。 我绝对爱他

现在这可能被认为是讽刺或不嘲讽,唯一的了解方法似乎是知道B是否严重。

(我不应该深入了解。我们得到了一堆短语,只是被告知如果这些短语在句子中,那么这是讽刺的,但我有兴趣吗?)

有什么办法可以解决此问题?还是在讽刺时计算机绝对卡住了?

(我想这取决于扬声器的音调,但我的输入是文字)

参考资料:
Stack Overflow
收藏
评论
共 3 个回答
高赞 时间 活跃

看起来有些研究只是尝试了这一点,但是他们还没有提出一种运行良好的算法。

来自González-Ibáñez的R.等人。 “在Twitter中识别讽刺:近距离观察”

讽刺和讽刺是在语言学,心理学和认知科学中经过充分研究的现象[...]。但是,在文本挖掘文献中,讽刺讽刺的自动检测被认为是一个困难的问题,仅在少数研究中得到了解决。 [...]与我们最相关的工作是Davidov等人的工作。 (2010年),其目的是在Twitter和亚马逊产品评论中识别讽刺和非讽刺话语。在本文中,我们考虑了区分讽刺性推文和非讽刺性推文的难题。

他们得出结论:

也许不足为奇的是,人类判断力和机器学习技术都没有表现出色。 [...]我们的结果表明,仅词汇特征不足以识别讽刺,而且务实和上下文特征值得进一步研究

这是另一篇近期相关的论文:
Reyes,A.“从幽默识别到讽刺发现:社交媒体的虚构语言”

收藏
评论

讽刺实际上与所说的语调有关,文字不具有人声,陈述真实的可行性还可以确定其讽刺...

如果输入是由用户键入的,则有两种方法可以执行。

一种是基于他们使用互联网术语写的东西。

例如:

用户可以输入:

"Yeah. Sure. I absolutely love him. /sarcasm"

您可以查找类似/sarcasm [/sarcasm]等的关键字


或者,您可以使用统计赔率:

"Yeah, and I'm the president of USA" ..统计事实正确的可能性很小,可以被标记为讽刺。

收藏
评论

...句子是由用户编写的。它是2个人之间的模拟对话。

仅凭一句话就几乎不可能检测出讽刺,但在上下文中它可能更可行。让我们假设您可以解析该句子并解释其字面意思(这不是一项琐碎的任务,但是至少已经解决了该问题)。

您现在具有以下内容的上下文:

  1. 对话中的所有短语。
  2. 一位发言人的回应。

交叉引用短语

要利用#1,您可以相互交叉引用所有短语。它们中的任何一个都直接矛盾吗?

例:

演讲者1 :我喜欢贾斯汀·比伯。你做?
演讲者2 :完全!我爱他。
演讲者1 :您最喜欢他什么?
演讲者2 :他的音乐真棒!
发言人1 :真的吗?你最喜欢的歌是什么?
演讲者2 :拜托,你知道我讨厌他的音乐。

我们知道有两个矛盾的短语,“我爱他!”和“我讨厌他的音乐”。至少有发生讽刺的机会。

其他发言人的问题或回应

方法2可能更有效(或没有用处……也许讽刺是已知的,但在两方之间却没有说出来)。

例:

发言人1 :贾斯汀·比伯(Justin Bieber)在城里。我很想见他。
发言人2 :哈。

另一个例子:

演讲者1 :我喜欢贾斯汀·比伯。你做?
演讲者2 :我的床头上贴着他的巨幅海报。
发言人1 :是的。

更加详尽地讲,您可以应用启发式方法来确定对话在特定短语之后的偏离程度。

演讲者1 :我非常喜欢贾斯汀·比伯!你是?
发言者1发表了重要讲话
发言人2 :是的,当然。
讽刺。我们不知道,但是对话中的其他人知道。

演讲者1现在朝什么方向?他们会改变话题吗?根据会话的转弯速度,它可能表明他们对感知到的反应有何反应。

综上所述,其中大多数将需要复杂的处理,而且我期望其准确率极低。但这是一个有趣的问题。

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号