随着诸如Google Assistant和Alexa之类的语音助手越来越多地进入物联网设备,越来越难以跟踪何时将录音发送到云以及谁可以访问它们。为了发现违规行为,北卡罗莱纳州立大学达姆施塔特分校和巴黎萨克莱大学的研究人员开发了LeakyPick,该平台可定期探测配备麦克风的设备,并监视随后的网络流量,以指示音频传输的模式。他们说,LeakyPick发现了数十个意外触发Amazon Echo说话者的单词。

语音助手的使用可能正在上升-Statista估计,截至2019年,全球设备中使用的助手约为42.5亿个-但对隐私的担忧并未减轻。报告还透露说意外激活暴露了合同工的私人谈话。这样做的风险是,包括Mischon de Reya在内的律师事务所已建议工作人员在谈论家庭客户事务时,让智能扬声器静音。

LeakyPick旨在识别隐藏的语音音频记录和传输,并检测可能受到威胁的设备。研究人员的原型建立在Raspberry Pi上,价格不到40美元,其工作原理是:在用户不在家时周期性地产生可听见的噪音,并使用适用于多种启用语音的设备的统计方法来监控流量。

研究人员声称,LeakyPick在检测语音流量方面准确度高达94%,适用于使用唤醒词的设备和不使用唤醒词的设备,例如安全摄像机和烟雾报警器。在前者的情况下,它已预先配置为在带有已知唤醒词和噪声的探测器(例如“ Alexa”,“ Hey Google”)之前添加前缀,并在网络级别上寻找“爆发”,而启用了麦克风的设备则不会通常不会发送太多数据导致网络流量增加。统计探测步骤用于过滤掉非音频传输导致突发的情况。

为了识别可能错误触发语音记录的单词,LeakyPick使用音素词典中与实际唤醒单词相比具有相同或相似音素计数的所有单词。(音素是一种语言中在感觉上截然不同的声音单位,可将一个单词与另一个单词区分开,例如英语单词pad,pat,bad和bat中的p,b,d和t)区分开。)LeakyPick还可以将a简单的英语单词列表。

研究人员使用Hive View评估了Eak Dot,Google Home,HomePod,Netatmo Welcome and Presence,Nest Protect和Hive Hub 360,对LeakyPick进行了测试。创建基线突发和统计探测数据集后,他们监视了八个设备的实时流量,并从英语的1,000个最常用词中随机选择了一组50个词,并结合了语音激活设备的已知唤醒词列表。然后,他们在52天的时间内让三个家庭的用户与三个智能扬声器(Echo Dot,HomePod和Google Home)进行交互。

该团队利用Echo Dot周围的LED环等指示器记录了设备开始侦听命令的时间戳,从而测量了LeakyPick的准确性。每次激活设备时,都会使用光传感器使LeakyPick进行标记,而通过放大器连接到Pi的3瓦扬声器产生声音,并通过Wi-Fi USB软件狗捕获网络流量。

在旨在测试LeakyPick识别未知唤醒词的能力的一项实验中,研究人员将Echo Dot配置为使用标准的“ Alexa”唤醒词,并让LeakyPick播放不同的音频输入,等待两秒钟以确保智能扬声器“听到”输入。根据研究人员的说法,回声点在多轮测试中“可靠地”响应了89个单词,其中有些单词在语音上与“ Alexa”非常不同,例如“ alachah”,“ lechner”和“电电学”。

所有89个单词都将音频记录流式传输到了亚马逊-另一项研究发现了1,000个错误地触发了Alexa,Siri和Google Assistant支持的设备的短语,这一发现不足为奇。该论文的共同作者(尚未发表)告诉Ars Technica,在某些情况下,这些设备会将音频发送到远程服务器,在远程服务器上,“更强大”的检查机制还将单词误认为是唤醒词。

LeakyPick的创建者写道:“随着智能家居物联网设备越来越多地采用麦克风,对实用的隐私防御的需求也越来越大。”“ LeakyPick代表了一种有前途的方法,可以减轻对智能家居隐私的真正威胁。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。