苹果大秀AI肌肉:详解Core ML框架及智能音箱HomePod

简介:
本文来自AI新媒体量子位(QbitAI)

“I love machine learning, especially since I’m a machine, learning. ”

—— Siri

与Google相比,今天凌晨的苹果全球开发者大会(WWDC)节奏超快。

苹果一口气连续发布了多款软硬件新产品、新服务。比方各种操作系统,包括iOS 11、macOS High Sierra、watchOS 4;新款iPad Pro;全新的iMac Pro;以及多年以来的又一款新产品:HomePod。

整场WWDC有一个因素贯穿始终,那就是机器学习。长期以来苹果都被认为在人工智能方面进展缓慢,但苹果显然不甘落后。

到底苹果秀了哪些AI肌肉?咱们一个一个说。

CoreML

我们来念一遍WWDC的全称:全球开发者大会(Worldwide Developers Conference)。

在iOS 11更好的Siri、手机上的AR背后,自然是面向开发者的新工具。Core ML就是苹果新推出的,面向开发者的机器学习框架。

苹果说,Core ML让开发者更容易把机器学习用到App里,文本分析、人脸识别等等功能,都可以依靠这个工具。苹果说,用了Core ML,iPhone上的人脸识别比Google Pixel上快6倍。

Core ML支持所有主要的神经网络:深度神经网络(DNN)、递归神经网络(RNN)、卷积神经网络(CNN),除此之外,它还支持SVM(支持向量机)、以及线性模型和树集成。

在Core ML的支持下,开发者可以把训练完成的机器学习模型,封装进App之中。

苹果强调用户隐私的一贯风格,在Core ML中也有承袭。Core ML让所有的机器学习计算都在iOS设备本地进行。

除了能支持超过30层的深度学习模型之外,Core ML还支持Tree ensembles,SVM和广义线性模型。

Core ML还能无缝切换于CPU和GPU之间,以提供最强的性能和效率。目前Core ML提供视觉和自然语言两个API。

关于Core ML的更多细节,请访问:

https://developer.apple.com/documentation/coreml

想要获取Core ML开发工具,可以访问如下网址:

https://pypi.python.org/pypi/coremltools

顺便说一句,苹果还为开发者推出了AR开发工具包ARKit。

Siri

在iOS 11中,Siri得到了一次大升级。

早在上个月,就有传闻称苹果要让Siri支持更多的App,从只能假装陪你聊天、用用iOS的原生功能,到可以操作你手机里安装的App。

传闻实现了,苹果在WWDC上宣布,Siri支持一系列第三方应用,包括微信,这个功能,叫做Siri Kit。

不过,苹果怎么会被传闻完全说中。

除了支持第三方应用,Siri还有更厉害的招数:更自然的语音、实时翻译、更精准的预测。

苹果负责技术的副总裁Craig Federighi说,“我们用深度学习为Siri打造了更自然、更富有表达力的声音。”

紧接着,他播放了英文版Siri的声音,男声版就讲了本文开头的那个冷笑话。不知道母语者感觉如何,量子位的母语不是英语,听起来,的确感觉与真人差异不大。不过,在后来展示实时翻译的时候,他又让Siri说了一下中文,听起来虽然比现在有很大提升,但终究还是像个机器。

实时翻译,就是在你用英语问Siri“How do you say … in Chinese?”,Siri就会立刻把你的话翻译成汉字显示在屏幕上,还要用中文给你念一遍。

这个实时翻译功能首先支持英译汉、西、意、法、德。

另外,Siri借助机器学习,还能更了解用户的兴趣,可以据此推荐新闻、帮用户回复消息,或者根据用户在浏览器中完成的订票行为,要求帮用户在日历上添加事件。

HomePod

对,HomePod就是传说中的苹果智能音箱。售价349美元。

美国、英国、澳大利亚三个国家首发,不过正式发布也要等到今年12月。其他国家和地区要等到明年发售。

这个新产品的发布,不仅仅是苹果全家桶又增了一项,而是再次确认了新趋势的不可阻挡。随着Apple Siri的发布,美国市值最高的三家科技巨头:苹果、Google、亚马逊,全部加入到智能音箱市场的争夺之中。

就在苹果发布会开始前几天,Google宣布Google Home智能音箱将于月底在加拿大发售,并随即启动预售,而且官方还降价促销。不过,最近几天Home也出现了问题,不少用户反馈这个智能音箱失去响应。

基本情况

 量子位注:目前Google Home官网打折,从6月4日开始,售价下调至109美元。

HomePod高度约7英寸,底部设有7个环绕喇叭,内置低音炮,整个产品由A8芯片控制,支持实时声音建模。通过芯片,HomePod可以完成声场设置、降噪和语音识别工作,而且还能对空间进行识别调整。

音质

毕竟是音箱,怎么也得谈谈音质。

在今天的发布会上,苹果大谈HomePod音质如何如何好,不过目前还无法确切得知。因为今天的HomePod只能看,不能摸,而且现场的展品也没有发出声音。

另外两家,Home能提供更丰富的环绕音质,Echo在低音方面有缺陷,但也有人觉得更自然。最近Home升级之后,也能支持蓝牙播放了,在这点上终于追上Echo。这两个设备都支持Pandora、Spotify。

当然区别还是有一些,Echo支持Amazon Music;而Home支持Google Play Musci、YouTube Red;HomePod显然支持Apple Music。

语音控制

智能音箱主要使用语音交互来控制音乐播放、搜索、智能家居等。Echo的唤醒指令比较丰富:Hey Alexa、Alexa、Amazon、Echo、computer都行。而Home的唤醒指令是:OK, Google以及Hey, Google。HomePod肯定要用:Hey Siri。

这些产品都使用了远场语音识别技术,Echo和Home能在15米外识别用户的语音指令。HomePod据说距离更远。

在硬件方面,Amazon Echo使用6+1配置的环形麦克风阵列,而Google Home使用的是双麦克风方案。Echo能更好的对声源方向进行定位。而苹果发布的HomePod使用了6个麦克风进行声音采集。

虚拟助手

每个智能音箱内部,都住着一个人工智能程序。Echo住的是Alexa,Google Home住的是Google Assistant。HomePod住着Siri。

在使用体验方面,Google Assistant能够从网上获取更多的信息,因而也能更好的回答用户提出的问题,而Alexa更擅长处理购物相关的请求。而关于Siri,目前可以在各位的苹果手机上试验一下。

Google Assistant在语音交互方面更进一步,能够根据前一个问题,继续回答用户的相关追问。毫无疑问,在问答方面Google优势明显。

苹果发布的信息显示,HomePod目前可以播放音乐、新闻、天气及股票等信息,设置提醒,通报交通和附近的状况,并与HomeKit集成用于控制智能家居设备。

当然,以上所有智能音箱的语音交互都得通过英语完成。

功能扩展

Home目前有200个第三方技能,可以帮助用户从达美乐订购披萨,也能从Uber叫车。但是Echo已经掌握了超过11000个新技能,而且能向Google Calendar添加事件、从Gmail里提取行程细节,这些反而Home都做不到。

Echo可以帮你免费打电话或发短信给任何一个使用Echo设备或Alexa App的用户。而Google Home现在可以给手机打电话了。

Google的产品支持多用户和多房间功能,Home可以辨认最多六位用户的声音,并且能无缝切换不同用户的账号和设置。

而Amazon的用户得跟Echo说“切换账户到某某”才行。Home能在不同的房间同步音频,而Echo现在还不行。

目前HomePod这方面的表现还不得而知。但可以想见,未来正式发售时,Siri一定会有更大幅度的更新,支持这个全新的硬件。

竞争解析

智能音箱这个市场,亚马逊是绝对的先行者。

2014年11月6日,亚马逊面向会员和受邀用户推出了Echo。这款产品于2015年6月23日在美国正式发售。目前,亚马逊共有三款不同型号的Echo系列产品在售。价格从50美元-230美元不等,瞄准不同用户群。

Google扮演了追赶者的角色。2016年5月,Google在I/O大会上正式发布Home。2017年5月的I/O大会上,Home发布了一些新功能。不过目前Google Home仍然只有一款型号在售,但可选择的配色方案更丰富。

来自eMarketer的报告显示,智能音箱市场Amazon Echo一家独大,占据70%的市场份额,Google Home的份额为23%。其余所有人分享5%。现在苹果也杀进来了,不知道这个格局未来会怎样发展。

从这个格局来看,Google对苹果的入局反应最大也是情理之中。

实际上,当年Amazon Echo推出的时候并不受到重视,然而时至今日,这款产品累积销售额据称已达10亿美元,还有市场分析机构预测,到2020年Amazon的智能音箱销售额将达100亿美元,产品销量过亿。

调查也显示,美国市场各年龄段的用户,对于语音控制设备的使用量,也呈现出了明显的增加。这也是人工智能等相关技术发展的一个结果。

智能音箱看起来好像“并不复杂”,但实际上却需要语音识别、语义分析、虚拟助手等诸多领域的人工智能技术在背后支撑。

其他要点

iOS 11

通过iCloud可将iMessage里的对话内容进行云端同步;iMessage还加入了Apple Pay,可直接在对话中进行转账。

Siri将支持微信等更多应用,并通过深度学习可以理解用户言语,结合上下文进一步知晓兴趣爱好等,甚至可以预知用户即将开启的App。

新版Camera将会支持HEVC编码格式,每张照片的压缩率将为此前的两倍。iOS 11还可以从Live视频中提取静态图片。

iOS 11还重新设计了控制中心和通知中心。iOS 11还针对中国市场加入了二维码扫描、诈骗短信识别、拼音键盘以及上海话语音识别等功能。

除此以外,macOS High Sierra提供了性能更好的Safari浏览器,新的Mail更好的支持搜索并减少存储空间。

硬件

新款iPad Pro发布。支持10小时的续航时间,12核苹果A10处理器,图像性能提升40%,配备1200万像素摄像头,支持光学防抖,支持4K视频的录制。新款iPad Pro有10.5和12.9英寸两种尺寸,售价649和799美元起。

全新iMac Pro发布,全线产品均配备27英寸5K屏幕、128GB ECC内存、4TB SSD硬盘,并搭配全新的工作站级显卡Radeon Vega。iMac Pro会配备8核、10核、18核的英特尔至强处理器,价格4999美元起。

【完】

本文作者:李林 若朴
原文发布时间:2017-06-06
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
15天前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
11天前
|
存储 XML 人工智能
深度解读AI在数字档案馆中的创新应用:高效识别与智能档案管理
基于OCR技术的纸质档案电子化方案,通过先进的AI能力平台,实现手写、打印、复古文档等多格式高效识别与智能归档。该方案大幅提升了档案管理效率,确保数据安全与隐私,为档案馆提供全面、智能化的电子化管理解决方案。
103 48
|
13天前
|
人工智能 数据挖掘 数据库
拥抱Data+AI|破解电商7大挑战,DMS+AnalyticDB助力企业智能决策
本文为数据库「拥抱Data+AI」系列连载第1篇,该系列是阿里云瑶池数据库面向各行业Data+AI应用场景,基于真实客户案例&最佳实践,展示Data+AI行业解决方案的连载文章。本篇内容针对电商行业痛点,将深入探讨如何利用数据与AI技术以及数据分析方法论,为电商行业注入新的活力与效能。
拥抱Data+AI|破解电商7大挑战,DMS+AnalyticDB助力企业智能决策
|
14天前
|
人工智能 数据库 决策智能
拥抱Data+AI|如何破解电商7大挑战?DMS+AnalyticDB助力企业智能决策
本文为阿里云瑶池数据库「拥抱Data+AI」系列连载第1篇,聚焦电商行业痛点,探讨如何利用数据与AI技术及分析方法论,为电商注入新活力与效能。文中详细介绍了阿里云Data+AI解决方案,涵盖Zero-ETL、实时在线分析、混合负载资源隔离、长周期数据归档等关键技术,帮助企业应对数据在线重刷、实时分析、成本优化等挑战,实现智能化转型。
拥抱Data+AI|如何破解电商7大挑战?DMS+AnalyticDB助力企业智能决策
|
4天前
|
人工智能 文字识别 运维
AI多模态的5大核心关键技术,让高端制造实现智能化管理
结合大模型应用场景,通过AI技术解析高端制造业的复杂设备与文档数据,自动化地将大型零件、机械图纸、操作手册等文档结构化。核心技术包括版面识别、表格抽取、要素抽取和文档抽取,实现信息的系统化管理和高效查询,大幅提升设备维护和生产管理的效率。
|
4天前
|
机器学习/深度学习 人工智能 安全
AI与旅游业:旅行规划的智能助手
在数字化浪潮中,人工智能(AI)正重塑旅游业。本文探讨了AI如何通过个性化推荐、智能预测与预警、语音交互与虚拟助手、增强现实体验及可持续发展,提升旅行规划的效率、安全性和趣味性,推动旅游业创新与变革。
|
6天前
|
人工智能 自然语言处理 关系型数据库
从数据到智能,一站式带你了解 Data+AI 精选解决方案、特惠权益
从 Data+AI 精选解决方案、特惠权益等,一站式带你了解阿里云瑶池数据库经典的AI产品服务与实践。
|
7天前
|
人工智能 安全 搜索推荐
AI与能源管理:智能电网的未来
本文探讨了AI与智能电网的融合及其对能源管理的深远影响。智能电网利用先进的信息、通信和AI技术,实现电力的自主、智能化、高效管理。AI在精准预测电力需求、实时监测与故障诊断、智能能源调度、个性化能源服务和优化可再生能源利用等方面发挥关键作用,推动能源管理的高效、智能和可持续发展。
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
AI与法律行业:智能法律咨询
在科技飞速发展的今天,人工智能(AI)正逐渐渗透到法律行业,特别是在智能法律咨询领域。本文探讨了AI在智能法律咨询中的应用现状、优势及挑战,并展望了其未来发展前景。AI技术通过大数据、自然语言处理等手段,提供高效、便捷、低成本且个性化的法律服务,但同时也面临数据隐私、法律伦理等问题。未来,AI将在技术升级、政策推动和融合创新中,为用户提供更加优质、便捷的法律服务。
|
10天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在金融领域的应用:智能投资顾问
【10月更文挑战第31天】随着AI技术的快速发展,智能投资顾问在金融领域的应用越来越广泛。本文介绍了智能投资顾问的定义、工作原理、优势及未来发展趋势,探讨了其在个人财富管理、养老金管理、机构风险管理及量化交易中的典型应用,并分析了面临的挑战与机遇。智能投资顾问以其高效、低成本、个性化和全天候服务的特点,正逐步改变传统投资管理方式。

热门文章

最新文章