苹果大秀AI肌肉:详解Core ML框架及智能音箱HomePod

简介:
本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=png&wxfrom=5&wx_lazy=1

“I love machine learning, especially since I’m a machine, learning. ”

—— Siri

与Google相比,今天凌晨的苹果全球开发者大会(WWDC)节奏超快。

苹果一口气连续发布了多款软硬件新产品、新服务。比方各种操作系统,包括iOS 11、macOS High Sierra、watchOS 4;新款iPad Pro;全新的iMac Pro;以及多年以来的又一款新产品:HomePod。

整场WWDC有一个因素贯穿始终,那就是机器学习。长期以来苹果都被认为在人工智能方面进展缓慢,但苹果显然不甘落后。

到底苹果秀了哪些AI肌肉?咱们一个一个说。

CoreML

我们来念一遍WWDC的全称:全球开发者大会(Worldwide Developers Conference)。

在iOS 11更好的Siri、手机上的AR背后,自然是面向开发者的新工具。Core ML就是苹果新推出的,面向开发者的机器学习框架。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

苹果说,Core ML让开发者更容易把机器学习用到App里,文本分析、人脸识别等等功能,都可以依靠这个工具。苹果说,用了Core ML,iPhone上的人脸识别比Google Pixel上快6倍。

Core ML支持所有主要的神经网络:深度神经网络(DNN)、递归神经网络(RNN)、卷积神经网络(CNN),除此之外,它还支持SVM(支持向量机)、以及线性模型和树集成。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在Core ML的支持下,开发者可以把训练完成的机器学习模型,封装进App之中。

苹果强调用户隐私的一贯风格,在Core ML中也有承袭。Core ML让所有的机器学习计算都在iOS设备本地进行。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

除了能支持超过30层的深度学习模型之外,Core ML还支持Tree ensembles,SVM和广义线性模型。

Core ML还能无缝切换于CPU和GPU之间,以提供最强的性能和效率。目前Core ML提供视觉和自然语言两个API。

关于Core ML的更多细节,请访问:

https://developer.apple.com/documentation/coreml

想要获取Core ML开发工具,可以访问如下网址:

https://pypi.python.org/pypi/coremltools

顺便说一句,苹果还为开发者推出了AR开发工具包ARKit。

Siri

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在iOS 11中,Siri得到了一次大升级。

早在上个月,就有传闻称苹果要让Siri支持更多的App,从只能假装陪你聊天、用用iOS的原生功能,到可以操作你手机里安装的App。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

传闻实现了,苹果在WWDC上宣布,Siri支持一系列第三方应用,包括微信,这个功能,叫做Siri Kit。

不过,苹果怎么会被传闻完全说中。

除了支持第三方应用,Siri还有更厉害的招数:更自然的语音、实时翻译、更精准的预测。

苹果负责技术的副总裁Craig Federighi说,“我们用深度学习为Siri打造了更自然、更富有表达力的声音。”

紧接着,他播放了英文版Siri的声音,男声版就讲了本文开头的那个冷笑话。不知道母语者感觉如何,量子位的母语不是英语,听起来,的确感觉与真人差异不大。不过,在后来展示实时翻译的时候,他又让Siri说了一下中文,听起来虽然比现在有很大提升,但终究还是像个机器。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

实时翻译,就是在你用英语问Siri“How do you say … in Chinese?”,Siri就会立刻把你的话翻译成汉字显示在屏幕上,还要用中文给你念一遍。

这个实时翻译功能首先支持英译汉、西、意、法、德。

另外,Siri借助机器学习,还能更了解用户的兴趣,可以据此推荐新闻、帮用户回复消息,或者根据用户在浏览器中完成的订票行为,要求帮用户在日历上添加事件。

HomePod

640?wx_fmt=png&wxfrom=5&wx_lazy=1

对,HomePod就是传说中的苹果智能音箱。售价349美元。

美国、英国、澳大利亚三个国家首发,不过正式发布也要等到今年12月。其他国家和地区要等到明年发售。

这个新产品的发布,不仅仅是苹果全家桶又增了一项,而是再次确认了新趋势的不可阻挡。随着Apple Siri的发布,美国市值最高的三家科技巨头:苹果、Google、亚马逊,全部加入到智能音箱市场的争夺之中。

就在苹果发布会开始前几天,Google宣布Google Home智能音箱将于月底在加拿大发售,并随即启动预售,而且官方还降价促销。不过,最近几天Home也出现了问题,不少用户反馈这个智能音箱失去响应。

基本情况

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

 量子位注:目前Google Home官网打折,从6月4日开始,售价下调至109美元。

HomePod高度约7英寸,底部设有7个环绕喇叭,内置低音炮,整个产品由A8芯片控制,支持实时声音建模。通过芯片,HomePod可以完成声场设置、降噪和语音识别工作,而且还能对空间进行识别调整。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

音质

毕竟是音箱,怎么也得谈谈音质。

在今天的发布会上,苹果大谈HomePod音质如何如何好,不过目前还无法确切得知。因为今天的HomePod只能看,不能摸,而且现场的展品也没有发出声音。

另外两家,Home能提供更丰富的环绕音质,Echo在低音方面有缺陷,但也有人觉得更自然。最近Home升级之后,也能支持蓝牙播放了,在这点上终于追上Echo。这两个设备都支持Pandora、Spotify。

当然区别还是有一些,Echo支持Amazon Music;而Home支持Google Play Musci、YouTube Red;HomePod显然支持Apple Music。

语音控制

智能音箱主要使用语音交互来控制音乐播放、搜索、智能家居等。Echo的唤醒指令比较丰富:Hey Alexa、Alexa、Amazon、Echo、computer都行。而Home的唤醒指令是:OK, Google以及Hey, Google。HomePod肯定要用:Hey Siri。

这些产品都使用了远场语音识别技术,Echo和Home能在15米外识别用户的语音指令。HomePod据说距离更远。

在硬件方面,Amazon Echo使用6+1配置的环形麦克风阵列,而Google Home使用的是双麦克风方案。Echo能更好的对声源方向进行定位。而苹果发布的HomePod使用了6个麦克风进行声音采集。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

虚拟助手

每个智能音箱内部,都住着一个人工智能程序。Echo住的是Alexa,Google Home住的是Google Assistant。HomePod住着Siri。

在使用体验方面,Google Assistant能够从网上获取更多的信息,因而也能更好的回答用户提出的问题,而Alexa更擅长处理购物相关的请求。而关于Siri,目前可以在各位的苹果手机上试验一下。

Google Assistant在语音交互方面更进一步,能够根据前一个问题,继续回答用户的相关追问。毫无疑问,在问答方面Google优势明显。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

苹果发布的信息显示,HomePod目前可以播放音乐、新闻、天气及股票等信息,设置提醒,通报交通和附近的状况,并与HomeKit集成用于控制智能家居设备。

当然,以上所有智能音箱的语音交互都得通过英语完成。

功能扩展

Home目前有200个第三方技能,可以帮助用户从达美乐订购披萨,也能从Uber叫车。但是Echo已经掌握了超过11000个新技能,而且能向Google Calendar添加事件、从Gmail里提取行程细节,这些反而Home都做不到。

Echo可以帮你免费打电话或发短信给任何一个使用Echo设备或Alexa App的用户。而Google Home现在可以给手机打电话了。

Google的产品支持多用户和多房间功能,Home可以辨认最多六位用户的声音,并且能无缝切换不同用户的账号和设置。

而Amazon的用户得跟Echo说“切换账户到某某”才行。Home能在不同的房间同步音频,而Echo现在还不行。

目前HomePod这方面的表现还不得而知。但可以想见,未来正式发售时,Siri一定会有更大幅度的更新,支持这个全新的硬件。

竞争解析

智能音箱这个市场,亚马逊是绝对的先行者。

2014年11月6日,亚马逊面向会员和受邀用户推出了Echo。这款产品于2015年6月23日在美国正式发售。目前,亚马逊共有三款不同型号的Echo系列产品在售。价格从50美元-230美元不等,瞄准不同用户群。

Google扮演了追赶者的角色。2016年5月,Google在I/O大会上正式发布Home。2017年5月的I/O大会上,Home发布了一些新功能。不过目前Google Home仍然只有一款型号在售,但可选择的配色方案更丰富。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

来自eMarketer的报告显示,智能音箱市场Amazon Echo一家独大,占据70%的市场份额,Google Home的份额为23%。其余所有人分享5%。现在苹果也杀进来了,不知道这个格局未来会怎样发展。

从这个格局来看,Google对苹果的入局反应最大也是情理之中。

实际上,当年Amazon Echo推出的时候并不受到重视,然而时至今日,这款产品累积销售额据称已达10亿美元,还有市场分析机构预测,到2020年Amazon的智能音箱销售额将达100亿美元,产品销量过亿。

调查也显示,美国市场各年龄段的用户,对于语音控制设备的使用量,也呈现出了明显的增加。这也是人工智能等相关技术发展的一个结果。

智能音箱看起来好像“并不复杂”,但实际上却需要语音识别、语义分析、虚拟助手等诸多领域的人工智能技术在背后支撑。

其他要点

iOS 11

通过iCloud可将iMessage里的对话内容进行云端同步;iMessage还加入了Apple Pay,可直接在对话中进行转账。

Siri将支持微信等更多应用,并通过深度学习可以理解用户言语,结合上下文进一步知晓兴趣爱好等,甚至可以预知用户即将开启的App。

新版Camera将会支持HEVC编码格式,每张照片的压缩率将为此前的两倍。iOS 11还可以从Live视频中提取静态图片。

iOS 11还重新设计了控制中心和通知中心。iOS 11还针对中国市场加入了二维码扫描、诈骗短信识别、拼音键盘以及上海话语音识别等功能。

除此以外,macOS High Sierra提供了性能更好的Safari浏览器,新的Mail更好的支持搜索并减少存储空间。

硬件

新款iPad Pro发布。支持10小时的续航时间,12核苹果A10处理器,图像性能提升40%,配备1200万像素摄像头,支持光学防抖,支持4K视频的录制。新款iPad Pro有10.5和12.9英寸两种尺寸,售价649和799美元起。

全新iMac Pro发布,全线产品均配备27英寸5K屏幕、128GB ECC内存、4TB SSD硬盘,并搭配全新的工作站级显卡Radeon Vega。iMac Pro会配备8核、10核、18核的英特尔至强处理器,价格4999美元起。

【完】

本文作者:李林 若朴
原文发布时间:2017-06-06
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
11天前
|
人工智能 自然语言处理 算法
|
1天前
|
机器学习/深度学习 人工智能 搜索推荐
AI与未来医疗:智能化的医疗新时代
在当今科技迅速发展的时代,人工智能(AI)正逐渐渗透到我们生活的方方面面。特别是在医疗领域,AI技术的引入不仅为传统医疗注入了新的活力,更为未来的健康管理和疾病治疗带来了无限可能。本文将深入探讨AI在未来医疗中的应用及其潜在影响,从早期诊断、个性化治疗到患者管理,全面解析AI如何改变我们的医疗体验。
|
3天前
|
人工智能 搜索推荐 算法
AI与未来医疗:智能化诊疗的新篇章
在21世纪的科技浪潮中,人工智能正迅速融入各行各业。医疗领域作为关乎人类健康和生命的重要领域,自然也不例外。本文将探讨AI在未来医疗中的应用及其潜在影响,从智能诊断到个性化治疗,再到医疗机器人和远程医疗。通过对技术实现原理、应用场景及未来展望的分析,揭示AI如何改变传统医疗模式,提高诊疗效率和准确性,为患者带来更好的医疗体验。
|
4天前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【9月更文挑战第12天】在当今科技飞速发展的时代,人工智能(AI)已深入我们的生活,从智能助手到自动驾驶,从医疗诊断到金融分析,其力量无处不在。这一切的核心是神经网络。本文将带领您搭乘Python的航船,深入AI的大脑,揭秘智能背后的秘密神经元。通过构建神经网络模型,我们可以模拟并学习复杂的数据模式。以下是一个使用Python和TensorFlow搭建的基本神经网络示例,用于解决简单的分类问题。
26 10
|
6天前
|
人工智能 自然语言处理 安全
【通义】AI视界|2分钟看完苹果发布会:iPhone16 5999元起售,全系支持苹果AI
本文精选了过去24小时内的重要科技新闻,包括苹果发布iPhone 16、Sora模型发布时间未定、快手可灵AI发布导演共创计划、高盛对ChatGPT流量下滑的误判以及vivo即将发布蓝心大模型。文章详细介绍了各新闻的关键信息和背景,帮助读者快速了解最新动态。点击链接访问通义官网,体验更多功能。
|
6天前
|
机器学习/深度学习 人工智能 自动驾驶
AI与未来:探索智能技术的新纪元
【9月更文挑战第9天】本文将探讨人工智能(AI)的发展历程、现状和未来趋势。我们将从AI的基本概念入手,逐步深入到其在各个领域的应用,以及它对社会的影响。最后,我们将展望AI的未来,探讨其可能带来的变革。
|
4天前
|
人工智能 运维 监控
智能化运维:AI在IT管理中的角色与挑战
随着科技的不断进步,人工智能(AI)已经渗透到我们生活的方方面面,其中包括IT运维领域。本文将探讨AI如何改变传统运维模式,提高效率和准确性,并分析在实施智能化运维时可能遇到的挑战。
|
6天前
|
人工智能 算法 安全
AI伦理:探索智能时代的道德边界
【9月更文挑战第10天】随着AI技术的发展,我们步入了智能时代,AI的应用为社会带来便利的同时,也引发了伦理道德的讨论。本文探讨了数据隐私、算法偏见及系统透明度等伦理问题,并提出制定法规、行业自律、伦理审查及跨学科合作等策略,旨在确保AI技术的健康发展,构建智能、公平、安全的未来。通过共同努力,我们能在技术进步与道德边界间找到平衡点,推动社会持续进步。
|
7天前
|
人工智能 开发框架 搜索推荐
移动应用开发的未来:跨平台框架与AI的融合
在移动互联网飞速发展的今天,移动应用开发已成为技术革新的前沿阵地。本文将探讨跨平台框架的兴起,以及人工智能技术如何与移动应用开发相结合,从而引领行业走向更加智能化、高效化的未来。文章通过分析当前流行的跨平台开发工具和AI技术的应用实例,为读者提供对未来移动应用开发的独到见解和预测。
23 3
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
【智能助手体验】分享一款超好用的AI工具:Kimi
Kimi是一款由月之暗面科技有限公司开发的AI助手,具备强大的自然语言理解和文件内容解析能力,支持多种文件格式,并能结合互联网搜索提供全面答案。无论是在工作中的数据分析还是日常生活中的信息查询,Kimi都能给出满意的结果,展现出巨大的应用潜力。