名为TextFooler的软件可以通过用同义词替换句子中的某些单词来欺骗自然语言处理(NLP)系统,使其误解为文本。在测试中,它可以显着降低三个最新NLP系统的准确性。例如,Google强大的BERT神经网络在确定对Yelp的评论是正面还是负面时,差了5到7倍。

工作原理:

该软件由麻省理工学院的一个团队开发,用于寻找对NLP分类器最重要的句子中的单词,并用人类会觉得很自然的同义词代替它们。例如,将句子“在不可能的情况下铸造的角色与现实完全疏远”改为“在不可能的情况下铸造的字符与现实完全疏远”对我们的阅读方式没有真正的区别。但是这些调整使AI完全不同地解释了句子。

为何重要:

我们已经看到了许多这种对抗性攻击的例子,大多数情况下是在图像识别系统中进行的,其中输入的微小改动会混淆AI,并使AI对所看到的内容进行错误分类。TextFooler表明,这种攻击方式还打破了NLP,虚拟助手(如Siri,Alexa和Google Home)背后的AI以及垃圾邮件过滤器和仇恨语音检测器等其他语言分类器。研究人员说,诸如TextFooler之类的工具可以通过揭示NLP系统的弱点来帮助使其更强大。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。