苹果大秀AI肌肉:详解Core ML框架及智能音箱HomePod

简介:
本文来自AI新媒体量子位(QbitAI)

“I love machine learning, especially since I’m a machine, learning. ”

—— Siri

与Google相比,今天凌晨的苹果全球开发者大会(WWDC)节奏超快。

苹果一口气连续发布了多款软硬件新产品、新服务。比方各种操作系统,包括iOS 11、macOS High Sierra、watchOS 4;新款iPad Pro;全新的iMac Pro;以及多年以来的又一款新产品:HomePod。

整场WWDC有一个因素贯穿始终,那就是机器学习。长期以来苹果都被认为在人工智能方面进展缓慢,但苹果显然不甘落后。

到底苹果秀了哪些AI肌肉?咱们一个一个说。

CoreML

我们来念一遍WWDC的全称:全球开发者大会(Worldwide Developers Conference)。

在iOS 11更好的Siri、手机上的AR背后,自然是面向开发者的新工具。Core ML就是苹果新推出的,面向开发者的机器学习框架。

苹果说,Core ML让开发者更容易把机器学习用到App里,文本分析、人脸识别等等功能,都可以依靠这个工具。苹果说,用了Core ML,iPhone上的人脸识别比Google Pixel上快6倍。

Core ML支持所有主要的神经网络:深度神经网络(DNN)、递归神经网络(RNN)、卷积神经网络(CNN),除此之外,它还支持SVM(支持向量机)、以及线性模型和树集成。

在Core ML的支持下,开发者可以把训练完成的机器学习模型,封装进App之中。

苹果强调用户隐私的一贯风格,在Core ML中也有承袭。Core ML让所有的机器学习计算都在iOS设备本地进行。

除了能支持超过30层的深度学习模型之外,Core ML还支持Tree ensembles,SVM和广义线性模型。

Core ML还能无缝切换于CPU和GPU之间,以提供最强的性能和效率。目前Core ML提供视觉和自然语言两个API。

关于Core ML的更多细节,请访问:

https://developer.apple.com/documentation/coreml

想要获取Core ML开发工具,可以访问如下网址:

https://pypi.python.org/pypi/coremltools

顺便说一句,苹果还为开发者推出了AR开发工具包ARKit。

Siri

在iOS 11中,Siri得到了一次大升级。

早在上个月,就有传闻称苹果要让Siri支持更多的App,从只能假装陪你聊天、用用iOS的原生功能,到可以操作你手机里安装的App。

传闻实现了,苹果在WWDC上宣布,Siri支持一系列第三方应用,包括微信,这个功能,叫做Siri Kit。

不过,苹果怎么会被传闻完全说中。

除了支持第三方应用,Siri还有更厉害的招数:更自然的语音、实时翻译、更精准的预测。

苹果负责技术的副总裁Craig Federighi说,“我们用深度学习为Siri打造了更自然、更富有表达力的声音。”

紧接着,他播放了英文版Siri的声音,男声版就讲了本文开头的那个冷笑话。不知道母语者感觉如何,量子位的母语不是英语,听起来,的确感觉与真人差异不大。不过,在后来展示实时翻译的时候,他又让Siri说了一下中文,听起来虽然比现在有很大提升,但终究还是像个机器。

实时翻译,就是在你用英语问Siri“How do you say … in Chinese?”,Siri就会立刻把你的话翻译成汉字显示在屏幕上,还要用中文给你念一遍。

这个实时翻译功能首先支持英译汉、西、意、法、德。

另外,Siri借助机器学习,还能更了解用户的兴趣,可以据此推荐新闻、帮用户回复消息,或者根据用户在浏览器中完成的订票行为,要求帮用户在日历上添加事件。

HomePod

对,HomePod就是传说中的苹果智能音箱。售价349美元。

美国、英国、澳大利亚三个国家首发,不过正式发布也要等到今年12月。其他国家和地区要等到明年发售。

这个新产品的发布,不仅仅是苹果全家桶又增了一项,而是再次确认了新趋势的不可阻挡。随着Apple Siri的发布,美国市值最高的三家科技巨头:苹果、Google、亚马逊,全部加入到智能音箱市场的争夺之中。

就在苹果发布会开始前几天,Google宣布Google Home智能音箱将于月底在加拿大发售,并随即启动预售,而且官方还降价促销。不过,最近几天Home也出现了问题,不少用户反馈这个智能音箱失去响应。

基本情况

 量子位注:目前Google Home官网打折,从6月4日开始,售价下调至109美元。

HomePod高度约7英寸,底部设有7个环绕喇叭,内置低音炮,整个产品由A8芯片控制,支持实时声音建模。通过芯片,HomePod可以完成声场设置、降噪和语音识别工作,而且还能对空间进行识别调整。

音质

毕竟是音箱,怎么也得谈谈音质。

在今天的发布会上,苹果大谈HomePod音质如何如何好,不过目前还无法确切得知。因为今天的HomePod只能看,不能摸,而且现场的展品也没有发出声音。

另外两家,Home能提供更丰富的环绕音质,Echo在低音方面有缺陷,但也有人觉得更自然。最近Home升级之后,也能支持蓝牙播放了,在这点上终于追上Echo。这两个设备都支持Pandora、Spotify。

当然区别还是有一些,Echo支持Amazon Music;而Home支持Google Play Musci、YouTube Red;HomePod显然支持Apple Music。

语音控制

智能音箱主要使用语音交互来控制音乐播放、搜索、智能家居等。Echo的唤醒指令比较丰富:Hey Alexa、Alexa、Amazon、Echo、computer都行。而Home的唤醒指令是:OK, Google以及Hey, Google。HomePod肯定要用:Hey Siri。

这些产品都使用了远场语音识别技术,Echo和Home能在15米外识别用户的语音指令。HomePod据说距离更远。

在硬件方面,Amazon Echo使用6+1配置的环形麦克风阵列,而Google Home使用的是双麦克风方案。Echo能更好的对声源方向进行定位。而苹果发布的HomePod使用了6个麦克风进行声音采集。

虚拟助手

每个智能音箱内部,都住着一个人工智能程序。Echo住的是Alexa,Google Home住的是Google Assistant。HomePod住着Siri。

在使用体验方面,Google Assistant能够从网上获取更多的信息,因而也能更好的回答用户提出的问题,而Alexa更擅长处理购物相关的请求。而关于Siri,目前可以在各位的苹果手机上试验一下。

Google Assistant在语音交互方面更进一步,能够根据前一个问题,继续回答用户的相关追问。毫无疑问,在问答方面Google优势明显。

苹果发布的信息显示,HomePod目前可以播放音乐、新闻、天气及股票等信息,设置提醒,通报交通和附近的状况,并与HomeKit集成用于控制智能家居设备。

当然,以上所有智能音箱的语音交互都得通过英语完成。

功能扩展

Home目前有200个第三方技能,可以帮助用户从达美乐订购披萨,也能从Uber叫车。但是Echo已经掌握了超过11000个新技能,而且能向Google Calendar添加事件、从Gmail里提取行程细节,这些反而Home都做不到。

Echo可以帮你免费打电话或发短信给任何一个使用Echo设备或Alexa App的用户。而Google Home现在可以给手机打电话了。

Google的产品支持多用户和多房间功能,Home可以辨认最多六位用户的声音,并且能无缝切换不同用户的账号和设置。

而Amazon的用户得跟Echo说“切换账户到某某”才行。Home能在不同的房间同步音频,而Echo现在还不行。

目前HomePod这方面的表现还不得而知。但可以想见,未来正式发售时,Siri一定会有更大幅度的更新,支持这个全新的硬件。

竞争解析

智能音箱这个市场,亚马逊是绝对的先行者。

2014年11月6日,亚马逊面向会员和受邀用户推出了Echo。这款产品于2015年6月23日在美国正式发售。目前,亚马逊共有三款不同型号的Echo系列产品在售。价格从50美元-230美元不等,瞄准不同用户群。

Google扮演了追赶者的角色。2016年5月,Google在I/O大会上正式发布Home。2017年5月的I/O大会上,Home发布了一些新功能。不过目前Google Home仍然只有一款型号在售,但可选择的配色方案更丰富。

来自eMarketer的报告显示,智能音箱市场Amazon Echo一家独大,占据70%的市场份额,Google Home的份额为23%。其余所有人分享5%。现在苹果也杀进来了,不知道这个格局未来会怎样发展。

从这个格局来看,Google对苹果的入局反应最大也是情理之中。

实际上,当年Amazon Echo推出的时候并不受到重视,然而时至今日,这款产品累积销售额据称已达10亿美元,还有市场分析机构预测,到2020年Amazon的智能音箱销售额将达100亿美元,产品销量过亿。

调查也显示,美国市场各年龄段的用户,对于语音控制设备的使用量,也呈现出了明显的增加。这也是人工智能等相关技术发展的一个结果。

智能音箱看起来好像“并不复杂”,但实际上却需要语音识别、语义分析、虚拟助手等诸多领域的人工智能技术在背后支撑。

其他要点

iOS 11

通过iCloud可将iMessage里的对话内容进行云端同步;iMessage还加入了Apple Pay,可直接在对话中进行转账。

Siri将支持微信等更多应用,并通过深度学习可以理解用户言语,结合上下文进一步知晓兴趣爱好等,甚至可以预知用户即将开启的App。

新版Camera将会支持HEVC编码格式,每张照片的压缩率将为此前的两倍。iOS 11还可以从Live视频中提取静态图片。

iOS 11还重新设计了控制中心和通知中心。iOS 11还针对中国市场加入了二维码扫描、诈骗短信识别、拼音键盘以及上海话语音识别等功能。

除此以外,macOS High Sierra提供了性能更好的Safari浏览器,新的Mail更好的支持搜索并减少存储空间。

硬件

新款iPad Pro发布。支持10小时的续航时间,12核苹果A10处理器,图像性能提升40%,配备1200万像素摄像头,支持光学防抖,支持4K视频的录制。新款iPad Pro有10.5和12.9英寸两种尺寸,售价649和799美元起。

全新iMac Pro发布,全线产品均配备27英寸5K屏幕、128GB ECC内存、4TB SSD硬盘,并搭配全新的工作站级显卡Radeon Vega。iMac Pro会配备8核、10核、18核的英特尔至强处理器,价格4999美元起。

【完】

本文作者:李林 若朴
原文发布时间:2017-06-06
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
5天前
|
人工智能 搜索推荐
写歌词的技巧和方法:塑造完美歌词结构的艺术,妙笔生词AI智能写歌词软件
歌词是音乐的灵魂,其结构艺术至关重要。开头需引人入胜,主体部分无论是叙事还是抒情,都应层次分明、情感丰富,结尾则需升华或留白,给人以深刻印象。《妙笔生词智能写歌词软件》提供多种AI辅助功能,助你轻松创作完美歌词,成为音乐创作的得力助手。
|
5天前
|
人工智能
巧妙构建歌词结构:写歌词的技巧和方法之关键,妙笔生词AI智能写歌词软件
在音乐世界里,歌词是灵魂的载体,构建其结构至关重要。优秀的歌词需有引人入胜的开头、条理清晰且富变化的主体,以及深刻难忘的结尾。《妙笔生词智能写歌词软件》提供多种功能,帮助创作者克服结构难题,激发灵感,助你写出打动人心的歌词,开启音乐创作的新篇章。
|
5天前
|
人工智能
歌词结构的巧妙安排:写歌词的方法与技巧解析,妙笔生词AI智能写歌词软件
歌词创作是一门艺术,关键在于巧妙的结构安排。开头需迅速吸引听众,主体部分要坚实且富有逻辑,结尾则应留下深刻印象。《妙笔生词智能写歌词软件》提供多种 AI 功能,帮助创作者找到灵感,优化歌词结构,写出打动人心的作品。
|
6天前
|
人工智能
写歌词的技巧和方法基础篇:奠定创作基石,妙笔生词AI智能写歌词软件
写歌词是音乐创作中既具魅力又具挑战的任务。初学者需掌握基础技巧,如明确主题、合理布局结构、简洁生动的语言运用。《妙笔生词智能写歌词软件》提供 AI 智能写词、优化、取名等功能,帮助新手快速提升创作水平,为成功创作打下坚实基础。
|
1天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI驱动下的IT运维革命###
本文探讨了人工智能(AI)技术在IT运维领域的创新应用,强调其在提升效率、预防故障及优化资源配置中的关键作用,揭示了智能运维的新趋势。 ###
|
4天前
|
机器学习/深度学习 人工智能 运维
智能运维:大数据与AI的融合之道###
【10月更文挑战第20天】 运维领域正经历一场静悄悄的变革,大数据与人工智能的深度融合正重塑着传统的运维模式。本文探讨了智能运维如何借助大数据分析和机器学习算法,实现从被动响应到主动预防的转变,提升系统稳定性和效率的同时,降低了运维成本。通过实例解析,揭示智能运维在现代IT架构中的核心价值,为读者提供一份关于未来运维趋势的深刻洞察。 ###
39 10
|
4天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
38 6
|
5天前
|
人工智能
歌词结构的艺术:写歌词的技巧和方法深度剖析,妙笔生词AI智能写歌词软件
歌词是音乐的灵魂伴侣,其结构蕴含独特艺术魅力。掌握歌词结构技巧是创作者成功的关键。开头需迅速吸引听众,主体部分通过叙事、抒情或对话形式展开,结尾则点睛收尾。创作时可借助《妙笔生词智能写歌词软件》,利用 AI 功能优化歌词,提供丰富模板和案例,助力灵感涌现,轻松掌握歌词结构艺术。
|
5天前
|
人工智能
写歌词的技巧和方法:打造完美歌词结构,妙笔生词AI智能写歌词软件
写歌词的技巧包括:开头吸引人,主体逻辑清晰,结尾画龙点睛。使用《妙笔生词智能写歌词软件》的AI功能,如智能写词、押韵优化等,可助你克服创作瓶颈,打造完美歌词结构,适用于民谣、摇滚、流行等多种风格。
|
5天前
|
人工智能
写歌词的技巧和方法:构建独特歌词结构的策略,妙笔生词AI智能写歌词软件
歌词创作如同搭建艺术殿堂,独特的歌词结构是其基石。掌握构建策略,让你的歌词脱颖而出。开头营造神秘氛围或出人意料的情感,主体部分采用倒叙、插叙或融合矛盾情感,结尾带来情感反转或深邃思考。《妙笔生词智能写歌词软件》提供 AI 智能写词、押韵优化等功能,助你轻松获取灵感,打造独特歌词结构。

热门文章

最新文章