防病毒供应商NortonLifeLock的研发部门NortonLifeLock Research Group今天发布了一个名为BotSight的浏览器扩展程序,旨在实时检测潜在的Twitter机器人。其背后的团队表示,BotSight旨在强调在用户的供稿中出现僵尸程序和虚假信息活动的情况,因为与大流行相关的虚假信息的传播确实达到了发烧之势。

BotSight,可作为Chrome,Brave,Firefox和Edge的扩展,可直接在Twitter时间轴,搜索,个人资料,关注者和单个tweet视图中为每个Twitter句柄添加机器人概率得分。除了注释配置文件外,该工具还突出显示了推文正文中以及转推,引用的推文,关注者,用户关注的帐户和描述中提到的所有句柄。

该团队说,重要的是,BotSight不会干扰或取代Twitter自身的反错误信息工作。其中包括带有关于当前局势的有争议或误导性信息的推文标签和警告消息。

为BotSight提供动力是一种AI模型,可以高度准确地检测Twitter机器人,并在研究数据集上获得0.967的曲线下面积(模型质量的常用指标)。(一个完美的AUC是1。)在其预测中,它考虑了20多个因素,包括基于IP的关联(地理上紧密联系的帐户),基于时间的关联(时间上紧密联系),用户名和句柄中自动化的迹象(和其他元数据),社交子图,内容相似性,Twitter验证状态,该帐户获得关注者的速率以及帐户说明。

根据NortonLifeLock的说法,僵尸程序通常在发布习惯上表现出规律性,而普通用户则没有这种习惯,而且它们通常是短暂的。他们还倾向于使用包含许多数字和随机字符的名称,并且会形成派系,在其中张贴相同的内容。

考虑到所有这些,BotSight团队在4TB的历史推文集上训练了该模型。对数据集的审查显示,总体上大约有5%的帐户是僵尸程序,但根据采样时间长短,在有关该大流行的推文中,有6%至18%的帐户是僵尸程序。一个单独的随机样本显示,按体积计,约有4%至8%的bot活动,表明bot对自己的行为具有战略意义,有利于时事使影响最大化。

该团队表示,在BotSight首次亮相之前,它花了六个月的时间在Twitter上滚动浏览该工具,以测试,改进和验证该模型。迄今为止,BotSight的用户已经分析了100,000多个Twitter帐户。

BotSight团队在博客中写道:“对虚假信息的了解比以往任何时候都多,但是对于真正虚假信息的了解仍然很少。”“ [The]数字因语言,主题和一天中的时间而异。这就是为什么在Twitter feed本身中看到它如此有用的原因。”

BotSight团队计划在不久的将来启动智能手机应用程序,它将与到目前为止已经发布的许多其他Twitter机器人识别工具一起使用。一些最受欢迎的网站包括印第安纳大学社交媒体Botometer天文台;SparkToro的假追随者审核工具;Botcheck.me;和Bot Sentinel。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。