物联网中机器学习的挑战和机遇

简介:

据研究报告到2020年,将有超过200亿台互联网连接设备投入使用,这些设备每年将产生超过500个zettabytes的数据,随着更多的技术进步,这个数字预计将继续大幅增加。对于已经投资物联网的70%以上的组织而言,所有这些数据自然代表了独特的竞争优势,并且获得了用于开发创新AI应用程序的宝贵信息和见解的巨大机会。
事实证明,对于数据科学家和机器学习工程师而言,物联网数据与商业领袖一样令人兴奋。从医疗保健和农业到教育和运输,物联网蓬勃发展的领域与其应用程序一样多样化,从发现新信息到决策控制。物联网数据科学为创建令人兴奋的新数据产品打开了大门。但是,我们将在本文中研究物联网数据科学的一些特殊性。

数据注意事项
正如我们所看到的,物联网构成了新数据的最大来源之一。物联网数据实际上可能被视为大数据的缩影。如果我们查看通过一个设备生成的数据,我们通常会处理相当少量的数据(即使这也正在改变)。然而,随着无数分布式设备生成连续的数据流,物联网产生了大量的数据。它的多样性同样令人印象深刻:物联网设备收集各种类型的信息,从音频到传感器数据,并且总体上负责数据格式多样性的奇妙爆发。因为这些设备靠近用户并不断收集信息,这个生成的数据通常是高速的; 这使得物联网数据特别适合时间序列建模。
但是物联网数据也有一些独特的方面,使得它的开发极具挑战性。由于在采集和传输过程中发生错误,因此通常会产生噪声。这使得构建,清理和验证数据的过程成为机器学习算法开发中的关键步骤。从本质上讲,物联网数据也是高度可变的,这是因为各种数据收集组件之间的数据流存在巨大的不一致,并且由于存在时间模式。不仅如此,数据本身的价值高度依赖于底层机制,捕获数据的频率以及处理数据的方式。即使来自特定设备的数据被认为是值得信赖的,我们仍然需要考虑到即使在类似条件下不同设备可能表现不同的事实。因此,在收集训练数据时捕获所有可能的情况在实践中是不可行的。

半监督学习
然而,物联网数据最显着的特征之一在于它的粗糙:因为物联网设备通过各种复杂的传感器收集数据,它们生成的数据通常非常原始。这意味着在提取业务价值并构建强大的AI应用程序之前,必须进行大量数据处理。事实上,在构建智能物联网应用程序时,将有意义的信号与噪声分离并将这些非结构化数据流转换为有用的结构化数据是最重要但危险的步骤。
大量的物联网应用需要使用有监督的机器学习,这是一类机器学习算法,需要在训练模型之前标记数据。由于手动标记大型数据集是一项耗时,容易出错且可能成本高昂的任务,因此机器学习专业人员通常会先着手标记的开源数据集开始,或者从少量数据开始标记。然而,物联网数据的困难来自于它的特殊性:因为这些数据通常是独一无二的,所以不能保证现有的开源数据集是随时可用的,因此工程师必须标记自己的数据。
但是,由于物联网数据的可变性,标记一个小的随机样本可能是不够的。考虑到这一点,这些是在监督算法训练中利用标记和未标记数据的半监督学习策略的完美环境。特别是主动学习,其中允许算法向群众工作者查询在训练时智能选择的训练实例的子集的标签,这是非常适合的方法,允许机器学习科学家获得类似的算法精度。标签成本的一小部分。

人群传感
在机器学习方面,物联网发展的一个非常有趣的方面是人群感知的出现。群体感知存在两种不同的形式:自愿,当用户自愿提供信息时,以及机会主义,当没有明确的用户干预时自动收集数据。这是物联网数据不仅可以为物联网应用的开发或改进做出贡献的一种方式,而且还可以用作其他非物联网应用的输入。
物联网实际上允许以前所未有的方式收集非常独特的数据集。因为每个设备生成的数据通常是人为的,所以用户可以标记或验证它。

模型开发
如今,人工智能取得令人瞩目的进步背后的主要因素之一是出现了更好的技术,例如GPU,可以实现更快的数据处理。物联网的机器学习带来了一个有趣的难题:虽然最好的模型需要接受大量数据的培训,但大多数物联网设备仍然受限于存储空间和处理能力。出于这个原因,安全有效地将大量数据从设备传输到服务器或云,反之亦然,这是开发AI应用程序的关键。在云计算时代,一种自然的解决方案是将数据导出到开发模型的云中,并在模型准备好使用后将模型导出回设备。这特别有吸引力,特别是因为预计到2021年,所有生成的数据中有94%将在云中处理,这意味着它也可以利用其他数据源,无论是历史数据还是源自其他物联网设备。然而,将复杂模型存储回存储器受限的设备本身就是一个挑战,因为具有大量参数的复杂模型(例如深度学习模型)本身通常非常大。另一方面,在用于推理步骤的从设备向云上的模型发送数据的解决方案也可能是次优的,尤其是在延迟需要非常低的情况下。将复杂模型存储回存储器受限的设备本身就是一个挑战,因为具有大量参数的复杂模型(例如深度学习模型)本身通常非常大。另一方面,在用于推理步骤的从设备向云上的模型发送数据的解决方案也可能是次优的,尤其是在延迟需要非常低的情况下。将复杂模型存储回存储器受限的设备本身就是一个挑战,因为具有大量参数的复杂模型(例如深度学习模型)本身通常非常大。
另一个挑战来自于物联网设备可能无法连续连接到云,因此可能需要一些本地参考数据进行离线处理,以及独立运行的能力。这是边缘计算架构变得有趣的地方,因为它使数据能够在边缘设备级别进行初始处理。当需要增强安全性时,这种方法特别有吸引力; 这也是有利的,因为这种边缘设备能够过滤数据,降低噪声并提高现场数据质量。
不出所料,人工智能工程师一直在努力实现两全其美,最终开发出雾计算,这是一个分散的计算基础设施。在这种方法中,数据,计算能力,存储和应用程序以最合理的方式在设备和云之间分布,最终通过将它们更紧密地结合在一起来利用它们各自的优势。

转学习
我们已经看到物联网设备能够生成大数据,但在实践中,使用外部历史数据集开发物联网智能应用程序的情况并不少见。这意味着可以依赖于由多个IoT设备的集合(通常是跨多个用户的相同类型的设备)生成的数据,或者依赖于完全不同的数据源。应用程序越具体和独特,现有数据集可用的可能性就越小 - 例如,当设备捕获与开源图像数据集没有相似性的非常特定类型的图像时就是这种情况比如Imagenet 。话虽如此,物联网应用实际上是几种现有现有模型的巧妙融合,这是很常见的。这使得转移学习很好地适应了物联网环境中智能应用的发展。
转移学习范例包括在数据集上训练模型(通常是金标准模型)并使用它来对另一个数据集进行推断。或者,可以使用在生成此模型期间计算的参数作为在实际数据集上训练模型的起点,而不是将模型初始化为随机值。在这种情况下,我们将原始模型称为“预训练”模型,我们对特定于应用程序的数据进行微调。这种方法可以将训练阶段加速几个数量级。使用相同的范例,可以使用由最终用户直接生成的数据来训练一般模型,然后根据具体情况对其进行细化和优化。

安全和隐私问题
由于互联网连接设备技术通过提供物理和网络世界之间的连接来扩展当前的互联网,因此它生成的数据非常通用,但也是导致严重隐私问题的原因。事实上,参与物联网的大约50%的组织认为安全是物联网部署的最大障碍。考虑到大约三分之二的物联网设备在消费者领域,以及个人的一些共享数据是如何,很容易理解为什么。这些问题加上与频繁数据传输到云上的预期风险相结合,解释了用户为何要求保护其数据的保证。
然而,当这些物联网应用程序由“联合”数据(即多个用户生成的数据)提供支持时,事情变得更加阴险:用户数据不仅可以直接泄露,还可以通过旁道攻击间接暴露,当恶意代理反向工程机器学习算法的输出以推断私人信息。由于这些原因,数据保护法明显有必要与技术和应用程序本身一起发展。

物联网机器学习是以人为本的机器学习
由于物联网设备使互联网更贴近用户并触及人类生活的各个方面,因此它们通常允许收集高度上下文和个人数据。物联网数据叙述其用户生活的故事,并使其比以往更容易理解用户的需求,愿望,历史和偏好。这使得物联网数据成为构建根据用户个性量身定制的个性化应用程序的完美数据。
而且,由于物联网通过收集高度个性化的数据以及提供高度个性化的应用程序和服务而非常密切地触及我们的生活,因此物联网机器学习可以真正成为以人为本的机器学习。

相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
相关文章
|
5月前
|
机器学习/深度学习 人工智能 算法
机器学习与人工智能在物联网中的应用
【6月更文挑战第6天】在一个阳光明媚的早晨,我听到同事热议机器学习和人工智能在物联网的应用,如智能家居、工业生产和医疗诊断。通过分析物联网的海量数据,这些技术带来便利与效率的提升。示例代码展示了如何使用机器学习算法进行数据分析。尽管面临数据安全等挑战,但未来前景广阔,我决定投身这一领域,探索更多可能。
83 2
|
5月前
|
机器学习/深度学习 人工智能 算法
机器学习与人工智能在物联网中的应用
【6月更文挑战第5天】在这个物联网时代,智能设备间的交互变得日益频繁。机器学习与人工智能赋予了这些设备学习和协作的能力,使它们能更好地理解和适应用户需求。例如,智能空调利用机器学习了解用户习惯,预调至适宜的温度;而人工智能在安防系统中通过视频分析识别异常行为,保障安全。此外,它们还应用于智能农业、交通、医疗等领域,如预测农作物生长、优化交通路线、提升医疗服务。一个简单的Python代码示例展示了如何用机器学习预测室内温度变化,揭示了其在物联网中的潜力。
113 1
|
4月前
|
供应链 物联网 区块链
新兴技术浪潮下的变革与机遇:区块链、物联网、虚拟现实的融合趋势
在科技不断进步的今天,区块链、物联网、虚拟现实等新兴技术正逐渐渗透到我们生活的方方面面。本文将深入探讨这些技术的发展趋势和应用场景,揭示它们如何相互融合,共同推动社会的进步。通过数据支持的分析,我们将展示这些技术在未来可能带来的变革与机遇。
39 0
|
5月前
|
供应链 物联网 区块链
新技术浪潮下的变革与机遇:区块链、物联网与虚拟现实的未来展望
随着科技的不断进步,新兴技术如区块链、物联网(IoT)和虚拟现实(VR)正逐步改变我们的工作和生活方式。本文将深入探讨这些技术的发展趋势和应用场景,揭示它们如何推动社会和经济的转型。通过数据分析和案例研究,我们将展示这些技术如何为各行各业带来创新的解决方案,并预测它们在未来可能的发展路径。
|
5月前
|
机器学习/深度学习 传感器 算法
物联网(IoT)数据与机器学习的结合
【6月更文挑战第6天】物联网和机器学习加速融合,驱动数据收集与智能分析。通过机器学习算法处理 IoT 数据,实现智能家居、工业生产的智能化。示例代码展示如何用线性回归预测温度。结合带来的优势包括实时监测、预警、资源优化,但也面临数据质量、隐私安全、算法选择等挑战。未来需强化技术创新,应对挑战,推动社会智能化发展。
154 0
|
6月前
|
机器学习/深度学习 传感器 物联网
【Python机器学习专栏】机器学习在物联网(IoT)中的集成
【4月更文挑战第30天】本文探讨了机器学习在物联网(IoT)中的应用,包括数据收集预处理、实时分析决策和模型训练更新。机器学习被用于智能家居、工业自动化和健康监测等领域,例如预测居民行为以优化能源效率和设备维护。Python是支持物联网项目机器学习集成的重要工具,文中给出了一个使用`scikit-learn`预测温度的简单示例。尽管面临数据隐私、安全性和模型解释性等挑战,但物联网与机器学习的结合将持续推动各行业的创新和智能化。
176 1
|
存储 机器学习/深度学习 人工智能
数据网格在物联网、人工智能和机器学习中的用例和应用
在这篇文章中,我们讨论了网格在不同设置中的实际应用。
217 15
数据网格在物联网、人工智能和机器学习中的用例和应用
|
机器学习/深度学习 传感器 存储
为什么人工智能和机器学习与物联网紧密结合
IoT 中的 AI 和 ML 分析通过使用语义将原始数据转换为可操作的见解来实现生产力、效率和有效性的提升。
520 0
为什么人工智能和机器学习与物联网紧密结合
|
15天前
|
存储 供应链 物联网
探索未来:区块链、物联网与虚拟现实技术的融合与创新
【10月更文挑战第15天】本文深入探讨了新兴技术如区块链、物联网(IoT)和虚拟现实(VR)的发展趋势及其在现代社会的应用。通过分析这些技术的独特属性和它们如何相互补充,我们揭示了一个由高度互联、智能化和沉浸式体验定义的未来图景。文章不仅讨论了这些技术当前的挑战,还展望了它们在未来可能带来的转变,旨在为读者提供对这些令人兴奋的技术趋势的全面理解。
|
15天前
|
安全 物联网 区块链
未来已来:探索区块链技术、物联网与虚拟现实的融合趋势
【10月更文挑战第15天】 在数字化浪潮中,区块链、物联网(IoT)和虚拟现实(VR)技术正引领着一场革命。本文将深入探讨这三种技术的发展趋势和相互融合的潜力,以及它们如何共同塑造我们的未来。我们将从基本概念入手,逐步揭示这些技术如何影响经济、社会和日常生活,同时提供具体应用场景以展示其变革力量。

热门文章

最新文章

相关产品

  • 物联网平台