北京时间 5 月 12 日凌晨 1 点,谷歌在海岸线圆形露天剧场举办了 2022 Google I/O(Innovation in the Open)大会。作为今年首场面向全球开发者、合作伙伴和谷歌用户的年度科技盛会,此次活动时隔三年首次回归线下,与来自全球的用户通过线上共同见证精彩。
今年的大会,也是由谷歌 CEO Sundar Pichai 三年来首次亲自出席并主持的盛会。在主题演讲中,谷歌带来了下一代操作系统 Android 13 的更新,并正式推出了Pixel 6A智能手机、Pixel Watch 和 Pixel Buds Pro 耳机。(此外,还提前透露了 Pixel平板电脑以及Pixel 7和Pixel 7 Pro手机的预告片,后者定于秋季推出)。
会上,谷歌还强调了即时翻译、Flutter 3.0 等智能功能,并对其正在开发的 AR 眼镜进行了快速预览。除此之外,还有不少让开发者和谷歌用户惊喜的新技术新亮点,接下来赶快回顾一下吧!
推进知识和计算:Translation、Maps
大会一开始,我们便看到了谷歌 CEO Sundar Pichai 带来的一段关于“谷歌I/O的最新进展——推进知识和计算”的分享,以及这些新技术进展是如何帮助更多人无障碍沟通、让所有人都过得更好的。
Google Translation:众所周知,一直以来翻译都是是语言的一个技术难题,因为用来训练翻译模型的文本经常是双语文本。谷歌翻译新增了24种语言,可通过机器学习,能让翻译模型在从来没有见过某种新语的直译版本的情况下直接学习翻译新语言。
Google Maps:基于 3D 制图和机器学习技术,使用计算机视觉和神经网络技术实现对高质量图像和清晰建筑类型进行绘制,让谷歌从2020年7月以来Google Maps上的地区性建筑物数量增加了一倍,在全球范围内Google Maps上超过20%。
YouTube 视频可以自动生成章节和转录:应用DeepMind的多模式技术,可同时让文本、音频和视频以更高的准确性和速度自动生成章节;通过使用语音识别模型来转录视频(所有安卓和iOS用户都可使用视频转录)。基于该技术,谷歌下一步目标是将自动生成章节的视频数量增加10倍,从当前的800万个增加至明年的8000万个。
YouTube视频自动翻译字幕:此次谷歌将把YouTube视频的自动翻译字幕功能带到手机上。也就是说,用户现在就可以自动翻译16种语言的视频字幕,创作者可以扩大全球观众。
Google Workspace:谷歌文档通过机器学习模型之一进行文本摘要,谷歌文档将自动解析单词并提取要点,这也标志着自然语言处理的一大飞跃。目前,谷歌正在为Workspace中的其他产品发布摘要,并将在在接下来的几个月里出现在Google Chat上,提供一个有用的聊天对话摘要,用户可直接进入群聊或回顾关键的亮点。
Google Meet上的视觉改进:去年谷歌在I/O上引入了“Starline计划”后,便一直在测试反馈不断改进,以不断提高“虚拟空间”里的音频和视频质量。而受Starline启发的机器学习支持图像处理,可在Google Meet中自动提高图像质量。
计算的下一个前沿:增强现实/AR
本次大会上,谷歌还透露了关于AR技术的进展及计划 —— 增强现实/AR,未来新的计算前沿,有可能进一步扩展所有。“谷歌的设计方式是为现实世界而设计的,不会让你离开现实世界。AR为我们提供了实现这一点的新方法。”
目前,谷歌已经在该领域投入了大量资金,且一直在将 AR 技术应用到许多谷歌产品中,如谷歌镜头、搜索、场景探索以及地图中的实时和沉浸式视图等。
尽管未来还有很长的路要走,但谷歌依旧乐观的相信“ AR 技术能够打破语言障碍”,理解和被理解,这也是谷歌今天对知识和计算的关注的意义。
更广泛的愿景:Multisearch、Monk肤色量表
在Google 高级副总裁 Prabhakar Raghavan 带来的关于Google Search改进的分享里,为我们带来了谷歌今年关于“Search reimagined. Any way and anywhere”的新愿景——如何帮助人们以更直观的方式在搜索中找到有用的信息。
Multisearch“场景识别”:通过该功能,可以让我们日常生活中遇到所有无法描述的东西时,都能直接以拍照和提问的形式在谷歌应用中进行搜索。
此次谷歌还带来了“Multisearch Near Me”“场景探索”等新功能,更方便为我们日常生活场景中提供“想你所想”的搜索需求。
Monk Skin Tones:此次大会上,谷歌还带来了“Monk肤色量表”,这是一种谷歌AI 提供的一种新的免费和开源开发工具,是谷歌与哈佛大学 Ellis Monk 博士共同合作的旨在为肤色较深的人拍摄准确照片的工具,为建立更具包容性的AI体验。谷歌现已正式开放了Monk Skin Tones源代码,意在与业界共同合作以不断完善改进相关领域技术。
Google Assistant 大改进:Look and Talk
目前,全球已经有7亿用户使用Google Assistant,今天谷歌带来了2个新的技术——Look and Talk,可实施评估用户“心思”,让你不用每次都说两次“嘿 Google!”了,让大家能实现与设备互动的更自然、更类似对话的方式。
LaMDA 2模型:这是谷歌迄今为止最先进的即时对话AI,生成的语言模型用于对话应用程序,可以就任何话题进行对话,以此来实现“对话和自然语言处理是让每个人都能更容易地使用计算机的强大方式”的愿景。目前,谷歌已向数千名谷歌用户开放了LaMDA,在不断改进下,LaMDA大大提高了质量,减少了不准确或冒犯性的反应。
AI Test Kitchen:该功能可以让更多的人了解人工智能的功能,通过“Imagine It”“TalkAbout It”“List It”三部步,来轻松帮助创建列表。此外,还可通过AI Test Kitchen来用LaMDA做你关心的事情。
为了探索自然语言处理和人工智能的其他方面,谷歌还宣布了一个新模型——Pathways语言模型,简称PaLM。这是谷歌迄今为止最大的模型,训练了5400亿个参数。PaLM在许多自然语言处理任务上表现出突破性的性能,例如从文本生成代码、回答数学单词问题,甚至能解释笑话。
8个 TPU v4 吊舱加持:全球最大、公开的机器学习中心
随着谷歌在基础设施方面不断创新,近年来谷歌在诸多领域取得了不少进展。今天,谷歌还宣布计划在美国各地的数据中心和办公室投资95亿美元,并宣布于美国俄克拉荷马州为谷歌云客户推出有着8个TPU v4吊舱的世界上最大、公开可用的机器学习中心,以推动从医学到物流、可持续发展等多个领域的创新。
值得强调的是,这个机器学习中心已经以90%的无碳能源运行,且在即将到来的2030年,成为全球第一家以全天候无碳能源运营所有数据中心和校园的大公司。
Android 协同下的多设备世界
此次I/O大会上,谷歌还正式更新了旗下智能手机、手表和平板电脑设备软硬件,除Android 13操作系统之外,还包括Pixel 6a、Pixel Buds Pro、Google Pixel Watch、Pixel 7和Pixel平板电脑,以帮助用户的所有设备更好地协同工作。
Android 13 操作系统大升级
Android 13 Beta 2 :备受期待的Android 13 已测试了一段时间,尽管目前正式版暂未公布,但在本次大会上,Google 发布了 Android 13 Beta 2 版本,以打造一个“Android的多设备世界”的新远景。
Android 13 改进:扩展了 Material You 设计风格,改进了Google Messages 的 RCS (融合通信)支持方面的隐私与安全问题,通过端到端加密对群聊进行测试。此外,Android 13还对“应用程序默认可以使用的个人数据和手机功能的限制”以及“照片选取器”做了更新。
Google 硬件新品惊喜登场
Google Pixel Buds Pro耳机:这是首款结合了主动噪声消除技术和谷歌技术的耳机,可实现更好的隔离度和透明度(降噪)。在发布后将会有小更新(加入空间音频),可通过Android的Find My设备对其进行追踪。该耳机售价199美元,将于7月21日开始预购。
谷歌Pixel 6A、Pixel 7、Pixel 7 Pro:本次大会上,谷歌发布了售价449美元的谷歌Pixel 6入门级手机,该机将于7月21日开始预购。此外,谷歌还透露了Pixel 7系列,新机有一个可回收的铝制摄像头阵列和一个玻璃背板设计,还有一个基于人工智能优化的国产移动Tensor处理器的更新版本,新机将于今年秋季正式搭载Android 13。
Pixel Watch、Pixel 平板:谷歌新发布了Pixel Watch手表、Pixel 平板设备,新设备搭载改进的Wear操作系统界面,且配备了曲面玻璃屏幕。新设备将支持Google Wallet,并支持与Fitbit进行广泛兼容,预计将在秋季上市。而这款平板电脑是对Pixel手机的补充,预计将于2023年推出。
其他技术更新亮点
Flutter 3.0:今天谷歌正式推出了 Flutter 3.0,完成了从以移动为中心到多平台框架的路线图,提供了对 macOS 和 Linux 桌面应用的支持,以及对 Firebase 集成的改进,新的生产力和性能特性,并支持 Apple Silicon。
此外,Flutter 3.0 还进一步改进了不透明动画相关的性能,支持 iPhone 13 Pro 和 iPad Pro 等 iOS 上的 ProMotion 刷新率,还支持可折叠的移动设备。
Google Wallet:本次大会上谷歌还推出了 Google Wallet,可以直接作为驾照、银行卡、登机牌、门票使用,还支持 WearOS 用户使用。
作为一款与 Apple Wallet 和 Samsung Pay 等公司相互抗衡的产品,相信Google Wallet 会有不一样的惊喜体验。
综述
过去的一段时间里,先进的科技不仅帮助人类度过了一个个新挑战,也为全球性技术难题提供了助力。记得去年谷歌 I/O 2021大会上,谷歌就重点讨论了计算机科学中一些最具技术挑战性领域的新突破如何让谷歌产品在关键时刻变得更有帮助。今年的 2022 Google I/O上,谷歌再携新技术抢先在微软 Bulid 大会、苹果 WWDC 之前重磅“首发”,可谓有备而来。
本次大会上,谷歌携手一系列软硬件以及AI等大升级的新技术亮相活动,可谓是给接下来全球开发者的下一步计划带来了令人兴奋的动力。这些新技术所带来的创新,也恰好印证了本次谷歌 I/O 大会上所强调的“推进知识与计算”以及广泛愿景——“让更多人无障碍沟通,让更多人有公平的竞技场,科技让所有人都过得更好,持续努力创建未来”。