许多看起来不相关的事,其实都是相互有关联的。
不正经的需求
一个故事是公开的:最新一期 Nature 杂志发表华裔作者论文:通过解码大脑活动提升语音的清晰度,使用深度学习方法直接从大脑信号中产生口语句子,达到150个单词,接近正常人水平。武侠小说中的“传音入密”真的实现了。
另一个故事,来自最近我一个朋友的讲述。他带着准备好的综合能源管理方案,应邀去某个高校进行方案介绍——从水电支付结算、房间能耗管理,一应俱全。
结果对方还没等方案介绍完,就问了一句:你的方案能不能实时发现大功率电器的使用,然后实时预警,或者干脆断电?
这是一个来自高校宿舍管理的真需求。因为传统的能源管理只能监测到用电量等数据,无法判断接入的是哪一种具体的电器。而且,好像判断出是哪一种具体的电器这个功能,并不是什么正经的需求。
可是这才是有些高校进行宿舍综合能源管理的最迫切需求。因为一旦因为接入大功率且劣质的电器,比如电风吹、电水壶等造成火灾安全事故,后果是不可想象的。
同时,对方还告诉他,其实已经有厂商作出了能判断接入的是什么具体电器的方案,只不过报价比较贵。
所以你看,其实原理就是“传音入密”——去识别电力曲线的当中叠加的各种信号,识别出哪个曲线代表着电风吹&电水壶,然后判断是否断电。
它特别像我们在做音频处理时的波形。
大号的、离线的、插卡学习机
音频剪辑软件的界面,其本质就是无数段音频最终合成/图片来自网络
而之所以对方的报价比较贵的原因,我只能猜测它有两个步骤。
步骤一:首先需要大量的样本采集,知道哪些电器代表着什么样的波形,以及不同波形的组合之后,又有什么样的规律。这就涉及到算法;
步骤二:有可能它是把上面提到的这些样本,规规矩矩的输入在了本地的数据采集器上。也就是,每一台机器上都存好了这些数据样本。
其实以上步骤一是必要的,而且是核心竞争力。而步骤二并不需要。
这又让我想起一个多年前,参观某品牌家用人形机器人的经历。这个人形机器人能做出很多反应。看起来非常智能。我当时随口就问了一下,它能认出我的名字吗?工程师说,可以,不过我们需要把有关你名字的信息,输入到机器人的存储器上,让它产生关联,然后它就能认出你了。
所以那时候我明白了,这就是一个大号的、离线的、插卡学习机。
在线才能成本最低
可编程机器人/图片来自网络
一旦离线,深度学习无法在线完成,就需要人工一次又一次的上载数据。而且每一个本地化的机器人,都要配置一套完成的反应机制,一套完整的数据。这都需要成本。
而显而易见的是,在线才能成本最低。
回到我们刚才讲述的那个高校的需求。其实如果将各种电器的数据存储在云端,本地化的数据采集机器就只负责两件事:上传数据到云端,然后根据云端的判断来下一个简单的指令:断电。也就是说,本地根本就不需要算力。
这就是一个非常有趣的,从市场倒推回来的能源管理真实需求。而解决这个需求的真实动作,不是商业模式往前走,而是技术继续往前走。