智能家居暴露隐私?港中文等利用LSTM攻克IoT安全设定

简介: 今年 8 月份,香港中文大学张克环教授研究组在 arxiv 上公布了一篇文章,展示了他们组对于智能家居隐私性的研究。文章作者尝试使用 LSTM 模型对智能家居里的活跃设备进行预测。该预测可以使服务提供商(ISP)猜测用户正在家里使用什么类型的设备,从而有可能对拥有不同设备的用户有不同的商业推广手段。

微信图片_20211202012801.jpg



在此之前,已经有不少人做了相关的研究,但他们的研究大都是基于纯净的实验室环境,很难移植到复杂的现实环境中。作者通过分析真实世界中的 IoT 设备以及公开数据集,发现物联网设备的流量与桌面流量和移动流量相比有以下区别:


  • 同一类别的设备有相似的流量模式(下图为两种语音助手识别语音命令时的流量变化情况)


微信图片_20211202012806.jpg



  • 设备都有「心跳」传输来保证网络和设备的联通,不同设备的「心跳」模式不同
  • 不同设备传输协议比例不同(下图展示了 IoT 设备和非 IoT 设备的协议使用情况)


微信图片_20211202012810.jpg


作者认为,这些特征表明即使是在复杂场景下,而且具有一定的安全设备(NAPT 和 VPN)也能鉴别不同的 IoT 设备。由于现有的数据集不满足作者的要求,因此作者团队自己搭建了一个数据采集的系统。


实验数据收集


该系统包含 10 个 IoT 设备和 4 个非 IoT 设备,系统内设备如下图所示。


微信图片_20211202012813.jpg


作者准备在三个环境下收集流量信息:单一设备环境、多设备嘈杂环境 (使用 NAPT 技术) 以及 VPN 环境。首先介绍一下 NAPT 技术和 VPN 技术。NAPT 是一种网络地址转换技术,与 NAT 不同,NAPT 支持端口的映射。NAT 实现的是本地 IP 和 NAT 的公共 IP 之间的转换,因此本地局域网中同时与公网进行通信的主机数量就受到 NAT 的公网 IP 地址数量的限制。而 NAPT 克服了这种缺陷——NAPT 技术在进行 IP 地址转换的同时还对端口进行转换,因此只要 NAT 中的端口不冲突,就允许本地局域网的多台主机利用一个 NAT 公共 IP 就可以同时和公网进行通信。VPN 通常用于互连不同的网络,以形成具有更大容量的新网络。它是基于 IP 隧道机制,不同子网中的主机可以相互通信,并且可以通过认证和加密保密传送的信息。在生成流量的过程中,作者采用了两种触发方式:手动触发和自动触发,手动触发可以模拟真实环境下的人机交互,自动触发可以减轻实验者的负担。在自动触发模式下,作者使用 Monkey Runner 对需要用 APP 进行交互的 IoT 设备进行触发;对于语音助手等 IoT 设备,作者通过重复播放口令来进行触发。手动触发模式只在多设备场景下使用,在该模式下,作者通过随机进出房间来对房间内的试验设备进行触发。该种方式与自动触发相比,更具有随机随机性,从而有助于模型的泛化。整个流量收集过程持续 49.4 个小时,共收集 4.05GB 的数据,共包含 7223282 条有效通信包。


数据预处理


在进行实验评估之前,作者先对数据进行了预处理——将初始数据转换为模型能够处理的数值向量。
数据预处理过程可分为两部分,特征提取和制作数据包的标签。在特征提取过程中,共提取了五个特征,分别是端口 (dport)、协议 (protocol)、方向 (direction)、帧长 (frame length)、时间间隔 (time interval),并将这五个特征组成一维向量,如下图所示。


微信图片_20211202012817.png


在给数据包制作标签的过程中,针对在 VPN 环境下较难打标的问题,作者发现了如下规律,从而能够较精确地给数据包打标签:


  • 经过 VPN 处理后,数据包的体积会变大
  • 不同体积的数据包经过 VPN 加密后体积相同
  • VPN 会引起数据包传输延迟,这个延迟通常短于 0.02 秒


模型选择


在模型选择上,作者共选取了三个模型:随机森林(基线模型)、LSTM 模型以及 BLSTM(双向 LSTM)模型。由于随机森林无法直接学习离散值,作者对端口的特征值进行了独热编码处理。
对于 LSTM 模型,作者也对输入模型的数据进行了处理,他将多个连续向量进行了分组并组成流量窗,如下图所示。


微信图片_20211202012821.jpg


作者使用的 LSTM 模型如下图所示。该模型由多个基础模块组成,每个基础模块又包含有 Embedding 层、LSTM 层、全连接层以及 Softmax 层。


微信图片_20211202012824.jpg


由于 LSTM 模型在学习上下文信息时只能查看数据包的「过去」,因此作者又使用了 BLSTM 模型。BLSTM(双向 LSTM)是 LSTM 的扩展,它通过组合从序列末尾移动到其开头的另一个 LSTM 层来利用来自「未来」的信息。作者使用的 BLSTM 模型见下图。


微信图片_20211202012828.jpg


模型评估


数据集


共有两种数据集,Dataset-Ind 以及 Dataset-Noise。每种数据集又有两个版本:NAPT 版本和 VPN 版本。Dataset-Ind 数据集包含来自 10 个单独 IoT 设备的流量数据,这些数据被组成流量窗。Dataset-Ind 数据集共有 32760 个流量窗。
Dataset-Noise 数据集中的数据也是以流量窗的形式存在,与 Dataset-Ind 数据集不同的是,该数据集中的每个流量窗都是由多个设备的数据包组成。Dataset-Noise 数据集包含 114989 个流量窗。


评估指标


总精度(overall accuracy) 和分类精度(category accuracy)


微信图片_20211202012831.png

评估结果


在 Datatset-Ind 数据集下的评估结果如下表所示。从表中可以看出,LSTM 模型的精度普遍高于随机森林模型。


微信图片_20211202012835.jpg


随后,作者又在 Dataset-Ind 数据集下研究了流量窗大小对实验精度的影响,结果显示,流量窗越大,实验精度越高。因此,在接下来的实验中,流量窗的大小默认为 100。


微信图片_20211202012839.jpg


在 Dataset-Noise 数据集下的评估结果如下图所示。由图中可以看出,随机森林模型在该数据集下的总精度下降明显,在 NAPT 环境下总精度为 84.5%,在 VPN 环境下的总精度为 67.6%。而 LSTM 模型在 NAPT 环境下表现较好,在 VPN 环境下表现较差。


微信图片_20211202012842.jpg

作者对随机森林模型和 LSTM 模型精度降低的现象进行了分析,认为随机森林模型精度降低的原因是多个 IoT 设备和非 IoT 设备同时使用一个端口进行通信,使得该模型分类失败;而 LSTM 模型精度下降的原因,作者认为是由稀疏流量造成的:因此在 VPN 协议的极端情况下,智能插头(图中 orvibo, tplink)产生的流量包可以在流量窗口中被稀释到不到 3%。令这两款智能插头不能被识别出。(PS 根据这原理,我们上网用这个产生「噪声」的小程序也可以保障我们的隐私:https://github.com/1tayH/noisy


结论


根据实验结果,作者认为即使是在加密和流量融合的情况下,物联网设备的网络通信也会产生严重的隐私影响。人们应该进行更多该方面的研究,以更好地了解智能家居网络中地隐私问题并缓解此类问题。


相关资料:

1. Accessed: September 2019. "Can a MAC address be traced?". Available online at https://askleo.com/can_a_mac_address_be_traced/.

2. Acar A, Fereidooni H, Abera T, et al. "Peek-a-Boo: I see your smart home activities, even encrypted!". arXiv preprint arXiv:1808.02741, 2018. Available online at https://arxiv.org/pdf/1808.02741.

3. Bezawada B, Bachani M, Peterson J, et al. "Iotsense: Behavioral fingerprinting of iot devices". arXiv preprint arXiv:1804.03852, 2018. Available online at https://arxiv.org/abs/1804.03852.

4. Apthorpe N, Reisman D, Feamster N. "A smart home is no castle: Privacy vulnerabilities of encrypted iot traffic". arXiv preprint arXiv:1705.06805, 2017. Available online at http://arxiv.org/abs/1705.06805.

5. Apthorpe N, Reisman D, Sundaresan S, et al. "Spying on the smart home: Privacy attacks and defenses on encrypted iot traffic". arXiv preprint arXiv:1708.05044, 2017. Available online at http://arxiv.org/abs/1708.05044.

6. Accessed: September 2019.「Smart home blog」. Available online at https://blog.smarthome.com/.



作者介绍:芦新峰,吉林大学在读硕士,主要研究方向为目标检测。



文为机器之心原创,转载请联系本公众号获得授权

相关文章
|
17小时前
|
存储 安全 数据安全/隐私保护
智能家居安全:如何保护你的智能设备免受网络攻击
在数字化浪潮的推动下,智能家居逐渐成为现代生活的新宠。然而,随着设备联网的增加,安全问题也日益凸显。本文将探讨智能家居面临的网络安全挑战,并提供一系列实用的防护措施,帮助用户构建一个更加安全的智能家居环境。从基础的网络设置到高级的数据加密技术,我们将一一解析,确保您的智能生活既便捷又安全。
8 0
|
1天前
|
安全 物联网 网络安全
智能家居安全:物联网设备的风险与防护策略
【6月更文挑战第25天】在智能家居技术迅猛发展的今天,物联网(IoT)设备已成为现代生活的一部分。然而,随着这些设备的普及,安全问题也日益凸显。本文将深入探讨智能家居中物联网设备所面临的安全风险,并针对这些风险提出有效的防护策略。我们将从技术、用户教育以及政策制定三个层面,分析如何构建一个更加安全的智能家居环境。
|
1天前
|
安全 物联网 数据安全/隐私保护
智能家居安全:保护你的数字家园
【6月更文挑战第24天】本文将探讨智能家居设备的安全性问题,分析常见威胁和防御措施,并分享一些实用的安全建议。我们将从智能家居的安全挑战出发,深入到技术细节,最终提供一套全面的安全策略。读者将了解到如何通过技术和行为习惯来保护自己的数字家园免受黑客攻击。
14 3
|
4天前
|
安全 生物认证 区块链
智能家居安全:从理论到实践的全面解析
【6月更文挑战第22天】本文深入探讨了智能家居安全领域的核心问题,旨在为读者提供一套完整的安全解决方案。文章首先界定了智能家居安全的重要性和面临的挑战,随后详细分析了常见的安全威胁类型,并提出了相应的防御策略。通过案例分析,本文展示了如何将理论知识应用于实际中,以增强智能家居系统的安全性。最后,文章对智能家居安全的未来趋势进行了预测,并强调了持续研究的必要性。
|
5天前
|
监控 安全 网络安全
智能家居安全:保护你的数字家园
在数字化浪潮中,智能家居系统成为现代生活的延伸。本文深入探讨智能家居系统中的安全漏洞,分析黑客攻击的常见手段,并提供实用的防护策略。我们将从技术角度出发,为读者揭示如何通过多层次安全措施加固家庭网络,确保个人隐私和数据安全不受侵犯。
|
5天前
|
监控 安全 数据安全/隐私保护
智能家居安全:如何保护你的网络家园
【6月更文挑战第20天】在数字化时代,智能家居系统成为生活便利的代名词。然而,随之而来的安全隐患不容忽视。本文将深入探讨智能家居系统的潜在安全风险,并提供一系列实用的防护措施,帮助用户构筑一道安全的屏障,确保智能生活方式既便捷又安心。
|
6天前
|
安全 物联网 网络安全
智能家居安全:风险与防护策略
【6月更文挑战第20天】随着物联网技术的快速发展,智能家居系统逐渐融入人们的日常生活,提供便利的同时,也带来了新的安全隐患。本文从智能家居的安全风险出发,分析了当前智能家居系统面临的主要安全挑战,包括设备漏洞、数据隐私泄露和服务中断等问题,并探讨了相应的防护措施,如加强设备安全设计、采用加密技术保护数据、建立应急响应机制等。文章旨在提高用户对智能家居安全的认识,促进更安全的智能家居环境建设。
16 3
|
7天前
|
监控 安全 物联网
智能家居安全风险与防范措施
随着物联网技术的不断进步,智能家居系统已经越来越多地进入我们的生活。然而,随之而来的是各种安全问题和隐私泄露的风险。本文将深入探讨智能家居系统中存在的安全漏洞,分析黑客攻击的常见手段,并提出一系列有效的预防措施来保护我们的智能家居免受侵害。文章旨在提高用户对智能家居安全的认识,并指导如何构建一个更加安全的智能生活环境。
|
7天前
|
安全 物联网 网络安全
智能家居安全:从风险分析到防护措施的全面指南
随着物联网技术的飞速发展,智能家居系统已逐渐走入千家万户。然而,智能化带来的便捷背后隐藏着不容忽视的安全风险。本文深入探讨了智能家居系统中存在的各类安全威胁,并提出了一套综合性的安全防护措施。文章不仅涵盖了技术层面的解决方案,还强调了用户在提升家居安全中的关键作用。通过案例分析,本文旨在为读者提供一份实用的智能家居安全指南,确保技术便利与个人隐私的双重保障。
|
8天前
|
安全 物联网 网络安全
智能家居安全:物联网设备的风险与防护
【6月更文挑战第18天】随着科技的飞速发展,智能家居设备已经深入人们的日常生活。然而,这些便捷的智能设备背后隐藏着不容忽视的安全风险。本文将探讨智能家居中常见的安全威胁,并提供有效的预防措施,帮助用户构建一个更加安全的智能家居环境。