7 月 10 日,Google AI 负责人、「程序员大神」Jeff Dean,以及谷歌几位研究人员在日本东京与人们分享了如何运用 AI 解决当下众多社会问题,包括医疗、环境保护和灾难预防等领域问题的方法。
在现场,Jeff Dean 还为谷歌为多个人工智能算法申请专利的情况首次进行了说明,他表示:「这些有关算法的专利是防御性质的,主要是为了防止谷歌研究人员的成果被其他机构申请专利后进行讹诈,进而引发经济损失。」
对于谷歌自身而言,这部分专利不会用于获利。Jeff Dean 明确表示:「谷歌不会使用人工智能算法的专利来攻击别的公司。」
今年 6 月,有关谷歌为深度学习中「Dropout」等算法申请专利生效的事件引发了人们的广泛讨论。2012 年,深度学习先驱 Geoffrey Hinton 领导的谷歌研究团队首次引入了 Dropout,并在 AlexNet 中加以使用,获得了良好效果。今天,谷歌提出的很多算法正在被机器学习研究者,以及其他科技公司广泛使用。
Jeff Dean 昨天的回应或许可以让人们放松下来。对于谷歌来说,相比技术竞争,他们更看重的是如何正确地使用人工智能。在活动中,Jeff Dean 等人介绍了这家公司在过去一段时间里应用人工智能解决问题的案例。
从检测疾病到垃圾分类
AI 分析医疗图像预测癌症、帮助听力受损者、让文盲也可以通过手机与世界连接,预测自然灾害……谷歌今年在人工智能领域的应用,很多都是围绕帮助更多人这个主题推出的。
首先被介绍的是检测疾病的 AI。「我们知道,病症越早被发现,患者的生存几率就越高。但不幸的是,超过 80% 的肺癌病患都没有被提早发现,」Google AI 研究机构产品经理 Lily Peng 在活动中介绍道。「肺癌是最为常见的癌症,每年全球 3% 的死亡都是由肺癌造成的。如果提早发现(在 I 期)存活率可以提升接近 50%。」
在发布会上,谷歌介绍了和美国西北大学合作探究的人工智能 CT 图像检测算法,对比 6 名放射科医师,新技术可以减少 11% 的假阳性和 5% 的假阴性。该工作的研究结果在今年 5 月发表在了《Nature Medicine》杂志上。
除了用于检测早期肺癌的算法,Lily Peng 也介绍了检测乳腺癌和糖尿病视网膜病变的算法。
垃圾分类是最近国内最为关心的话题,谷歌提供的技术其实早已在帮助人们解决这个问题。Gringgo Indonesia Foundation 联合创始人 Febriadi Pratama 向我们介绍了如何利用谷歌的 AI 技术处理垃圾分类问题。
这家印度尼西亚机构成立于 2014 年,致力于使用人工智能技术进行垃圾分类与回收。他们在印尼城市 Denpasar 和数据公司 Datanest 合作,使用大量图片训练出了可以快速分类不同种类塑料的模型。现在如果你看到一些垃圾,拿起手机照一张照片,APP 不仅可以为不同的垃圾进行分类标记,还可以分析出其中可回收的塑料垃圾值多少钱。
「我们希望使用 AI 技术来从废弃物中寻找更多的价值。」Pratama 表示。
这一工作是 Google AI Impact Challenge 的获奖项目,开发者们正计划在未来几个月里同 Google AI 研究人员合作,将这种技术融入城市垃圾管理系统。
人工智还能帮助我们减少自然灾害带来的损失。「谷歌洪水预测倡议」试图解决洪水的问题。在印度,谷歌的研究人员和政府合作完成的项目已经可以覆盖大片地区,通过卫星图像,人工智能算法可以进行实时监测。
「预测洪水需要使用很多种不同的数据,建立极其复杂的模型,」谷歌软件工程总监 Sella Nevo 介绍道。「我们首先需要建立一个水力学模型,研究洪水出现时会影响到的地区。其中最大的挑战是缺乏足够高清的高程地图,我们使用卫星图像解决了这个问题,最终完成的地图精确程度可达 1 米级。」
另一个问题是地图的时效性。这个就需要及时更新的卫星图像了。谷歌使用的卫星有两个摄像头同时拍照,通过不同角度的照片输入给机器学习算法重建出高程图。在个基础上,谷歌还使用神经网络剔除了地图上的建筑物,这样才能模拟出真实的洪水扩散趋势。
和目前广泛使用的地震警告类似,谷歌已经在实验地区实现了手机端的洪水灾害警告(可以提前几个小时),同时也有较长期的灾害预告可提供给政府部门。
几个月前,谷歌向我们介绍了手机上的实时语音转录技术(Live Transcribe),它可以帮助听障人士与他人顺畅地交流,同时成本很低,每个人都可以获取。最近谷歌提出的 Euphonia 项目则把目光转向了那些因其他残疾而交流困难的人群,其中包括中风、渐冻症(ALS)、帕金森等疾病的患者。
通过人工智能语音识别模型,谷歌的设备经过训练可以理解语言障碍者不清楚的话语并将其转译为文字。而手势、眨眼等其他动作也可以成为交流的媒介。
Euphonia 旨在让沟通困难的人群生活更加独立。
除这些技术之外,谷歌还介绍了 AI 识别棉花病虫害、监视热带雨林盗砍、发现新物种、识别日文古代字体的方法。
更强大、更易用、更安全
无处不在的 AI 应用正在告诉我们技术的无限可能性。谷歌认为,人工智能今天的爆发其实还处在开始阶段。
「因为机器学习的存在,计算机现在可以做很多有趣的事情。识别不同的物体、翻译语言、识别语音,现在的人工智能也可以看图说话了,」Jeff Dean 说道。「仅仅在几年前,它还做不到这些事情。为什么只是在最近几年才发生呢?这个还是要从我的毕业论文说起。」
在活动现场,Jeff Dean 展示了他 1990 年的本科毕业论文。在其中他研究了神经网络训练反向传播的并行化可能性——只有更大的规模的计算才能让机器学习成功。但在当时因为计算机的算力有限,Jeff Dean 的研究显得有些过于超前,现在,并行化的训练方式已经被大量机器学习算法所采用了。
这篇仅有 8 页的毕业论文诞生在「AI 寒冬」时代。Jeff Dean 表示,其中的神经网络并行训练代码是用 C 语言编写的。
谷歌希望帮助人们构建能够创造价值的 AI,其在人工智能的开发上已经构成了一套道德规范,以指导新技术的研究和使用。基于这些原则,谷歌已经审查了超过 100 个项目,并在机器学习的公平性方面培训了数千名员工。
在技术上,新的机器学习形式联邦学习 (Federated Learning) 则是其中的最新案例。通过联邦学习,数据的分析过程可以在每个人的手机上完成——机器学习在自己的设备上运行,数据就不会泄露。而大量设备端分析后的抽象数据经过上传后可以上传到服务器端更新模型权重,这样既保护了隐私,又可以不断提高人工智能模型的准确性。
作为开发者和研究者们最为常用的工具,TensorFlow 今天已经有 4100 万的总下载量了。而对于不熟悉机器学习的人来说,谷歌也推出了云端 AutoML 工具,它可以帮助缺乏专业知识的用户在不同任务上使用 AutoML 技术自动生成 AI 模型,快速有效地完成目标。
「我们相信,人工智能可以帮助解决我们这个时代最困难的社会和环境问题,」Jeff Dean 说道。