中国的研究人员说,他们已经创建了讽刺检测AI,该AI在从Twitter提取的数据集上实现了最先进的性能。人工智能使用结合文本和图像的多模式学习,因为通常需要同时使用这两种方法来了解一个人是否在讽刺。
研究人员认为,嘲讽可以帮助情绪分析和众包理解公众对特定主题的态度。在今年早些时候发起的一项挑战中,Facebook正在使用多模式AI来识别模因是否违反了其服务条款。
研究人员的AI专注于文字和图像之间的差异,然后将这些结果结合起来进行预测。它还将标签与推文进行比较,以帮助评估用户试图传达的情感。
该论文读到:“特别是,输入标记将给与它们相对的图像区域以较高的关注度,因为不一致是讽刺的关键特征,”该论文写道。“由于不一致可能仅出现在文本(例如与无关图像相关的讽刺文本)内,因此有必要考虑模态内不一致。”
在Twitter的数据集上,与去年推出的多模式检测模型HFM相比,该模型的嘲讽检测F1得分提高了2.74%。与HFM的83%相比,新模型还实现了86%的准确率。
该论文由中国科学院和信息工程研究所共同在中国北京出版。该论文在本周的虚拟自然语言处理中的经验方法(EMNLP)会议上发表。
自AI研究人员于2016年开始在Instagram,Tumblr和Twitter上研究多模式内容的讽刺以来,AI是出现多模式讽刺检测的最新示例。
密歇根大学和新加坡大学的研究人员使用语言模型和计算机视觉来检测电视节目中的讽刺,该模型在题为“迈向多模式讽刺检测(显然是一篇很完美的论文)”的论文中进行了详细介绍。去年,这项工作是计算语言学协会(ACL)的一部分。