谷歌io开发者大会2018:AI无处不在

简介:

中国时间5月9日凌晨,谷歌一年一度的I/O开发者大会在旧金山山景城开幕。在两个小时的KeyNote演讲中,谷歌着重介绍了谷歌助手(Google Assitant)、安卓新版本Android P Beta的更新,以及一些谷歌软件(谷歌地图、谷歌新闻、谷歌摄像头)的更新,同时还谈到了谷歌在自动驾驶领域和TPU芯片研发的新进展。

  AI无处不在

  谷歌将AI作为公司的重点发展方向,在这场KeyNote演讲中,处处体现着这个特征。

  谷歌首席执行官Sundar Pichai首先登场,一上场,Sundar Pichai就谈了谷歌AI在不同领域的应用。

\
  比如在医疗领域,谷歌AI可以在糖尿病视网膜病变和心血管风险方面帮助诊断,还能帮助医生预测患者再次入院的可能性。又例如,通过AI与NLP技术,谷歌现在可以讲两个人同时讲话时的声音分割开来用文字显示。而且现在语言残障人士能够通过谷歌键盘(G-borad)用摩斯电码合成自己的声音。Sundar Pichai还提到了Gmail运用AI技术生成自动回复的功能。

  这些都是谷歌在AI领域的一些尝试,但大会的重点还是放在谷歌助手(Google Assitant)、安卓新版本Android P Beta上,尤其是谷歌助手,一度掀起大会现场的高潮。尤其是Pichai在现场展示的一段谷歌助手给人类打电话的视频DEMO,无论是答案合理的回复还是高度像人的语音语调,都足以骗过电话那头的人类、以假乱真。

  谷歌助手(Google Assitant)七大更新

  Google Assitant的更新发布是本次大会的重点。目前,已有超过5亿设备搭载Google Assitant,其中有超过5000种家居设备。Google Assitant今天的日常使用量同比翻了两番。目前,Google Assitant进入了80个国家,支持30余种语言。以下是Google Assitant的一些新进展。

  1.Google Assitant通过WaveNet可以合成更加自然的AI语音。目前,Google Assitant口音库中加入了6种口音类型,适应各地发音习惯,而且都非常自然。

  2.Google Assitant支持更自然的交流。为了与用户更好的交互,不仅是口音的多样化,Google Assitant比原来更了解人们的生活与表达习惯。例如,用户与Google Assitant进行多轮对话时,不再需要每句话都以“Hey Google”开头。这破解了之前AI语音助手难以进行多轮对话的问题。

  3.Google Assitant能更好的执行多重任务,它能辨别出用户发出指令中的多重并列指令,并做出相应的反应。

  4.Google Assitant更加适用于家庭教育场景。Google Assitant可提供超过13万儿童故事,而且新加入了Pretty please功能,鼓励小孩对Google Assitant进行礼貌提问。

  5.Google Assitant成为了可听化与可视化结合的助手。Google Assitant加入了Visually assistant功能,使Google Assitant不只对用户进行语音提示,并且在设备屏幕上显示相应的信息,更方便使用,例如显示导航路线、显示菜谱视频。

  6.三款搭载Google Assitant的带屏音箱将会于今年7月上市发售,包括JBL、联想、LG,Google旗下的YouTube资源也会向这些音箱开放。这些音箱都在今年CES上展示过。

  7.Google Assitant支持用户通过它进行订餐与预约,Doordash、711、星巴克等餐饮品牌都与Google Assitant进行了合作。

  为了展示Google Assitant的智能化程度,谷歌首席执行官Sundar Pichai播放了用Google Assistant打电话预约发廊服务和定餐厅的演示视频。Google Assistant在给发廊和餐厅的真人服务员打电话进行预约的过程中,让人几乎感觉不到这是AI与人的对话,而是人与人的对话。

  这个功能是通过谷歌开发许久的AI系统Google Duplex实现的,目前尚处于内测阶段。但这段演示已经吊足了人们的胃口,让人不禁更加期待Google Assitant带来的更多可能性。

  AI加持Android P Beta系统

  Android系统已有10年历史。谷歌副总裁Dave Burke上台谈到了谷歌发布的全新系统Android P Beta,他说,这可能是Android近几年来最大的更新。

  Dave Burke说,Android P Beta将成为谷歌把移动应用与AI结合的主要部分。Android P Beta有这些变化:

  1.预测几个小时内用户要用的应用,智能分配手机资源,节省电量;

  2.根据使用环境自动调节手机屏幕亮度;

  3.预测用户行为,为用户推荐应用;

  4.类似iPhone X的操作手势;

  5.管控用户花在手机上的时间,比如夜晚把手机屏幕调成灰色,降低用户对手机的欲望。

  6.谷歌还特别向开发者提供了一系列和AI相关的API:ML Kit,常见的AI功能都包含其中,而且更适合不太熟悉AI技术的开发者使用。

  Google News:AI做新闻

  谷歌此次推出了以AI驱动的新版Google News应用,有三项重点关注领域:让用户时刻关注新动态、理解新闻事件全貌、享受并支持你喜爱的媒体。跟今日头条很相似,Google News使用信息流的方式,用算法来推荐最适合你的新闻、短视频、深度文章、相关信息等。今天,Google News已在127个国家中上线。

  其中,News_cast功能会将新闻进行梗概,帮助用户快速了解信息。Full coverage功能则会打通网络上各种散乱信息之间的时间、逻辑联系,建立新闻专题,帮助用户了解新闻的来龙去脉。

  谷歌地图(Google Map):AI融入地图

  在使用地图应用的时候,用户最害怕的一点就是——不准确!

  然而,通过AI算法,Google Maps现在已经可以自动添加新开张的一些店铺,显示某一地点的路线变化,完善地图的准确性和完整性。除了告知用户到达目的地的路线之外,现在Maps还能向用户描述商店的开张时间、顾客在店内滞留的平均时长等信息。

\
  它还能为不同的用户定制他们关心的信息,比如居住地附近新开了什么店铺,推荐附近的美食——这一些都是建立在机器学习之上的,通过比对用户个人偏好的大量数据。用户也可以与朋友快速分享地图上的美食,并且在地图上进行实时标注。这能帮助用户快速做出决定并下单,也能为商户带来新的商机。

  此外,谷歌还介绍了“视觉定位系统”(Vision Position System,简称VPS)。简单来说,其就是通过手机摄像头,用AR技术来为用户进行导航。

  谷歌摄像头(Google Lens)

  此次大会对Google Lens的着墨也不少。

  谷歌介绍了Google Lens如何让摄像头、Google Map、GPS信息进行融合。Google Lens可以在真实街景上叠加左转、右转或者前行标志,使用户更直观地了解到自己该怎么去往目的地。为了使用户体验更有趣,谷歌还开发了一只虚拟狐狸给用户指路。

  同时Google Lens能进行更快更准确的文本识别。而且,在进行划词识别后,Google Lens不仅能理解字面意思,更能了解文本的背景和相关信息等,然后对文本相关信息进行展示。

  Google Lens不仅能识别文本,而且运用通过AI加持的VPS(视觉处理系统),还能识别图像、地标、食物等。

  Google Lens还推出了类似淘宝的用图片搜索相关商品的功能。

  无人驾驶:车自己预判路况

  值得一提的是,这是Waymo首次登上谷歌I/O大会。Uber和特斯拉、以及Waymo近来一直被爆出无人车事故,因此外界一直对自动驾驶相关技术争议颇大。不过,这并没有影响Waymo对新技术的憧憬。

  Waymo CEO John Krafcik描述了如何利用AI技术来解决无人驾驶研发中的各种各样的问题。

  Waymo提到,无人驾驶汽车对周边物体和环境的感知非常重要,通过不断的数据训练,其可以预测路上人与车的行动。其无人驾驶汽车已经积累了600万英里行驶里程,同时在仿真系统中已经行驶50亿英里。

\
  即使在极端恶劣的环境下,Waymo 的算法依旧能识别出车辆和道路。Waymo 无人车的算法训练使用了 Google TPU,这使得训练效率提高了 15 倍,有了 AI 算法的帮助,Waymo 即使在暴雪这样的恶劣环境中,都能将测试和训练继续进行下去。

  目前Waymo有2.5万辆车每天在路上验证各种路况。Waymo的讲解人举了个例子来说明神经网络的学习结果:无人车可以自己预测人们或车在横穿马路、闯红灯等行为提前预判,防止在过十字路口时候撞到闯红灯人或车。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

目录
相关文章
|
1月前
|
人工智能 自然语言处理 安全
谷歌:AI正在毁掉互联网!
【8月更文挑战第11天】这篇论文探讨了生成式多模态人工智能(GenAI)的滥用风险,基于2023-2024年间约200起事件分析,构建了GenAI滥用策略分类体系。GenAI虽潜力巨大,但滥用可能导致虚假信息传播、隐私泄露和社会动荡。论文识别了数据中毒、模型窃取及对抗样本攻击等多种滥用手段,并揭示了出于经济或政治动机的具体案例。同时,论文呼吁通过技术进步、法律监管及跨领域合作共同防范GenAI滥用,确保其健康发展。[链接: https://arxiv.org/abs/2406.13843]
113 60
|
28天前
|
人工智能 边缘计算 自然语言处理
谷歌微型AI模型“Gemma 2 2B”正出人意料地挑战科技巨头
谷歌微型AI模型“Gemma 2 2B”正出人意料地挑战科技巨头
谷歌微型AI模型“Gemma 2 2B”正出人意料地挑战科技巨头
|
8天前
|
人工智能 自然语言处理 安全
【通义】AI视界|谷歌推出AI搜索功能“问照片”,照片一问即得……
本文汇总了AI领域的最新动态,包括谷歌推出的“问照片”功能,使用户能用自然语言检索Google Photos;OpenAI的商业用户激增及ChatGPT的广泛应用;Anthropic发布的企业级AI助手Claude Enterprise;美英欧盟首个人工智能法律约束条约;OpenAI前首席科学家新公司获巨额融资;以及比尔·盖茨对AI前景的乐观展望与安全建议。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|
17天前
|
机器学习/深度学习 人工智能 算法
【悬念揭秘】ML.NET:那片未被探索的机器学习宝藏,如何让普通开发者一夜变身AI高手?——从零开始,揭秘构建智能应用的神秘旅程!
【8月更文挑战第28天】ML.NET 是微软推出的一款开源机器学习框架,专为希望在本地应用中嵌入智能功能的 .NET 开发者设计。无需深厚的数据科学背景,即可实现预测分析、推荐系统和图像识别等功能。它支持多种数据源,提供丰富的预处理工具和多样化的机器学习算法,简化了数据处理和模型训练流程。
31 1
|
30天前
|
人工智能 开发者 芯片
【51单片机】单片机开发者的福音: 让AI看电路图帮你编写程序(使用ChatGPT 中训练好的单片机工程师模型)
使用AI大语言模型编写 单片机程序. 使用的是 OpenAI公司发布的 ChatGPT .在ChatGPT上有别人训练好的 单片机工程师 with Keil uVision 5 - C Code Explainer模型, 可以上传电路图改模型可以通过这个用户所给的电路图进行编程.
【51单片机】单片机开发者的福音: 让AI看电路图帮你编写程序(使用ChatGPT 中训练好的单片机工程师模型)
|
1月前
|
机器学习/深度学习 人工智能
谷歌AI天气神算登Nature:30秒模拟22天天气,效率暴涨10万倍!
【8月更文挑战第9天】NeuralGCM是由谷歌AI团队开发的革命性天气预测模型,结合机器学习与传统大气物理模型,大幅提高了预测效率与准确性。它能在30秒内完成22天的天气模拟,效率比传统模型提升10万倍。NeuralGCM通过学习大量历史数据,其1至10天内的预测精度媲美甚至超过顶级模型,在极端天气预测方面也有出色表现。尽管尚存局限,如长期气候预测的精确度待提升,但NeuralGCM展现了在应对气候变化及气象挑战中的巨大潜力。【论文链接:https://www.nature.com/articles/s41586-024-07744-y】
34 7
|
1月前
|
数据采集 人工智能 NoSQL
生成式AI 未来发展的两大要素:数据和开发者
从过去一年的经验来看,未来也许还将发生翻天覆地的变革。所以,没人敢断言生成式 AI 的具体发展方向。但有一点可以肯定:数据和开发者,将始终是生成式 AI 未来发展的两大要素
3861 3
|
21天前
|
人工智能 分布式计算 大数据
大数据及AI典型场景实践问题之“开发者藏经阁计划”的定义如何解决
大数据及AI典型场景实践问题之“开发者藏经阁计划”的定义如何解决
|
26天前
|
人工智能 自然语言处理 机器人
谷歌AI Gemin怎么使用?Gemini国内使用指南!(2024.8.19)
从自然语言处理(NLP)到对话生成,AI语言模型已经成为科技界的一个重要组成部分。在众多杰出的AI语言模型中,Gemini凭借其卓越的性能和广泛的应用而脱颖而出。作为谷歌旗下的多模态AI巨头,Gemini融合了最先进的语言处理技术,为用户提供了无与伦比的语言理解和生成能力。