Emotech 的起点是 2014 年 8 月庄宏斌和 Chelsea 一起获得 UCL 学生创业大赛的第二名,这是 UCL 年度针对从本科到博士在内的全体学生的创业竞赛,负责人 Timothy Barney 直接授命于现任英女皇负责提升英国高校的创业水平。最初的产品叫 Happy Cube,目的改善白领在办公室工作的情绪。
虽然当时的产品仅是拥有浅层人工智能的桌面小装置,与现在功能强大的 Olly 无法相比,但这是庄宏斌探索「改变人类与机器关系」的第一步, 也是公司被命名为 Emotech, Emotion+Technology 的原因。
近日,「机器之心」独家对话了这家来自英国的初创企业。Emotech 的 创始人庄宏斌、联合创始人 Chelsea 、Jan,以及科学家团队中的 Pawel、Zarf 和 Pedro 分别就公司团队、技术、产品以及人工智能行业等问题接受了「机器之心」的采访。
关于产品和技术
机器之心:请介绍一下你们的产品,它能完成怎样的任务?
Emotech:我们目前在开发新的产品设计,今年 11 月左右会公布,到时再详细地介绍。简单来说,Olly 是世界上唯一具有独立个性的家用机器人,类人脑的情感互动是它的重要特色。
机器之心:HB 有丰富的产品管理经验,能否介绍下 Olly 的产品思路和理念?
Emotech:产品的思路源于之前做社会网络时对产品给用户带来价值的理解,2007 年人人网用户数量大爆发其中的一个关键因素是产品策略上的优化让用户找到失去联系的老同学/朋友,这里面是情感紧密联系的。当时一直在思考如何衡量产品给用户带来的价值,比如从表面的数据上,两个用户在吵架,带来的「UGC」要远比一句「我喜欢你」多得多,但显然价值和体验恰恰相反。
当然这只是一个简单的例子说明情感的重要性,深入下去会发现这其实在多方面有情感的理论根基,包括认知心理学和神经科学等等。所以我坚信下一代的交互模式情感是不可或缺的。技术上人工智能的发展和产品上情感设计的升级,让个人机器人成为可能。
等产品公布时可以比较系统和详细的讲。
机器之心:Echo 和 Google Home 等都有巨大的数据支持,作为一家创业公司,你们的技术在哪些方面有竞争优势?
Emotech:我们对于竞争的的理解:
第一,数据固然重要,但算法和模型也尤其关键,我们专注的领域和用户群比大公司要窄,而且我们同样拥有在这些领域的顶级科学家(语音识别、类人脑、增强式机器学习);
第二,边际效益递减,数据并非越多越好;
第三,Data-efficient Learning 也是我们的强项之一。
机器之心:在英语用户使用中学习到的经验能否迁移到汉语环境中,能迁移多大比例,还是要重新学习?
Emotech:语音信息的特征可以被学习和迁移到不同语言,这已经被很多研究验证了;另外有些数据(比如文字)可以通过很多线上资源低成本地获取,而有些数据(比如用户交互模型)是可以被抽象,与具体语言分离的。
机器之心:Olly 能够学习不同用户的个性,在家庭使用中,Olly 如何区分不同角色?
Emotech:产品设计理念上,我们参考了很多家里宠物尤其是狗和不同家人之间的关系和互动;技术上,声音、样子等等都可以成为角色区分的方法。
机器之心:预计语音助手技术何时成熟,迎来市场爆发?有进入汉语市场时间表吗?
Emotech:从技术方面,硬件上 MEMS 麦克风发展非常迅速,虽然还需要提高,但 1-2 年内质量和成本上都要大大优于现在;而目前随着深度学习的发展,我们已经看到很多可以通过算法方面来降低硬件要求的例子。
当然不同领域会有不同,比如车载的语音助手和家居语音助手的要求是不一样的。市场方面语音交互是和 GUI、触屏交互同一个量级的概念,但我们相信市场成熟需要的时间应该比智能手机花的时间短。
明年年底左右中文的 Olly 就会开始售卖。
机器之心:很多公司在开发语音助手时更倾向于基于已有的平台开发软件和服务,因为更简单,你们为什么要选择做更难的硬件呢?对于智能助手来说,硬件实体带来的最主要区别是什么?
Emotech:一方面实体机器人有多方面优势,包括数据收集和情感互动等, 我们尤其在 Olly 的动作方面做了很多吸引人的有趣设计;另一方面我们团队很多人都有创造一个实体机器人的梦想。最后就像滑雪一样,高级道的缆车排队的人远比低级道少得多。
机器之心:你们的产品应该是做开放域问题的 chatbot, 请问开放域 chatbot 难点有哪些?你们成功解决了哪些?
Emotech:我们的产品和 chatbot 还是有很多不同点。但就 chatbot 来说,基本的挑战主要集中在
1. 理解语义;
2. 确定内容;
3. 确定如何表达。
对于我们而言,在场景理解,情感和数据有效性等方面有很多优势,这对 Olly 和用户互动上有很大的帮助。
机器之心:开放领域的 chatbot 比特定领域的 chatbot 难度更大,为什么选择这个难度更大的领域而不是先从哪个领域内的 chatbot 做起呢?比起巨头,你们又有哪些优势?
Emotech:第一,我们做的事情和 chatbot 有一些共同点,但还是很不一样的;
第二,仅从难度方面探讨,难度小的事情没什么意思;
第三,相比起「开放域」或「通用」,我们更倾向于认为我们是找到了一个简洁优美,并且高度可扩展的方向。
机器之心:实体类的 chatbot 可以获得更丰富的 context 信息,包括语调,表情,历史对话,位置等,处理这么多类型的 context 是一个比较困难的问题,你们如何处理?
Emotech:Olly 的核心 AI 引擎本质上就是多重模态的;我们通过低层算法处理各种输入,然后用高层算法合并。举个例子不同算法处理音频和视频信息,而提取出来是什么人正在说话。
机器之心:要实现深层次的个性化需求需要来源广泛的各类数据,请问作为作为创业公司你们如何获得?或者是如何与其他公司合作?
Emotech:做一个令人兴奋的产品是关键,大家会觉得一起合作有前景,有意思。这里面既有我们寻求的合作伙伴,也有一些是看到我们的报道后,主动找到我们的。
机器之心:在获取多样化的数据之后,实现有意义的个性化还需要深层挖掘各数据之间的关系,并具有一定的长时记忆和推理能力,这些都是技术上的难点,请问 Olly 在技术上有什么创新?
Emotech:我们的 AI 引擎是一个高度可扩展的层级结构,这个架构有一个很大的好处就是支持我们对不同类型数据进行处理。
机器之心:你们如何保护用户的隐私?用户的历史数据你们如何处理?在用户隐私和提供个性化服务之间,你们的平衡理念是什么?
Emotech:我们对用户的隐私极度重视。首先我们只收集经过用户同意的数据,而且用户拥有对自己所有数据的完全控制;其次我们尽量进行本地化实时处理,如果需要通过云端,则尽量只传输提取后的特征数据,而且本地和云端都会经过严格的加密。
机器之心:human-inspired computing 是否可以理解为用机器学习理解问题?数据规模和质量的挑战都很大,如何解决问题?
Emotech:并不一样,比如飞机并不需要像鸟一样扇动翅膀,具备理解能力的算法并不需要像大脑一样。深度+一些特定的增强式学习方法会被用到。
关于团队
机器之心:目前公司规模及技术人员比例是怎样的?
Emotech:目前 15 名全职员工,会继续扩中到 25-30 名左右,其中 80% 为技术人员科学家。英国和美国是全球人工智能储备最多的国家,Emotech 会继续以伦敦为核心研发中心,同时开始向硅谷发展,吸收优秀的人工智能专家及市场领域的资深人员,为明年的年产与销售做准备,努力让 OLLY 成为世界上最有趣的个人机器人。
机器之心:Zaff 角色多重,这是保持创造力的方式吗?
Emotech:角色多重,在各跨界中都有专业水准并不是我们的用人标准,但似乎公司充满创造力,勇于改变和冒险的气氛吸引了这样的团队成员。创始人庄宏斌除了产品设计外,也是单板滑雪的狂热爱好者,在创业的巨大压力和紧迫时间下,还是会在冬季每个月去瑞士 Zermatt 峰报道;Chelsea 是科班出身的当代艺术投资专家,至今还在最大的艺术杂志《hiart》撰写专栏;Pedro 是乐队的贝斯手,还出过专辑;Pawel 热衷钢琴作曲等等
机器之心:对于一家聪明人聚集的人工智能公司,平时有哪些团队建设?
Emotech:吃吃喝喝是团队的重要娱乐之一,尤其是在伦敦美食地图 Szu 博士的领导下,这个拥有 14 国母语的超级国际化团队善于在伦敦的东区和 central 寻找各国美食,并在肉食动物和素食者之间找到平衡;宏斌、Jan、Pawel 都是单板迷,在计划冬天的集体滑雪;音乐和艺术也是团队的共同爱好,2 个钢琴,1 个古筝,1 个萨克斯风,1 个贝斯,等等。
娱乐之外,充电也是重要内容。公司支持团队成员相关或者不相关的学习,比如参与心理学互动研究、摄影、人工智能垮领域交流等。始终相信,没有不相关的学习,只有不断开拓未知领域,勇敢冒险,才能真正创造世界上最好的人工智能创业团队。
关于人工智能行业
机器之心:英国的很多人工智能创业公司都走上了被收购的道路,你如何看待这种现象?被收购是好事还是坏事?Emotech 未来是否走同样的路?
Emotech:首先很多美国的创业公司也被收购,另外很多英国人工智能公司被大公司类似 Google,Amazon 和 Apple 收购也从一个侧面反映了英国 AI 的技术积累和先进性。在去年 TechCrunch 获奖之后,我们已经收到不少来自产业基金的投资意向,但是为了最大程度的保持独立,按照我们的规划打造世界上最好的人工智能团队,生产最有趣的机器人,我们选择了现在的投资人。
但是,我们并不拒绝各种形式的跨界合作,开放平台与各种智能设备整合,或者 Olly 主体的特殊定制,还是人工智能软件与其他硬件厂商的合作,我们都非常乐意尝试,只要不违背我们向用户提供最好的「hands free 的人工智能体验,让用户体验更好的生活方式的原则」。
机器之心:Yann LeCun 说生成模型是机器学习领域过去十年最有趣的进展,你们认为近期的机器学习和人工智能有哪些重要的发展?
Emotech:我们非常惊喜地看到很多进展其实是硬件端带来的发展,很多解决方案是在相对简单但是通过大规模数据训练出来的模型。当然在理论方面的进展也是惊人的,比如对联结式模型机制的更深入理解所带来更优的方式优化和参数使用(例如注意力机制);另一方面是对多模式数据的联合处理,比如结合语言和视觉数据。
机器之心:DeepMind 大大提升了强化学习的热度,能否请 Pedro 给没有背景的专业读者解释说明一下?
Emotech:大家应该比较熟悉图片分类的算法,这类算法需要判断每给定一张图片中是否有一只猫或者房子等,这样的任务是一张张图片完成但相互间不会影响。与这类算法不同,经典增强式学习的问题的例子包括让一个机器人走出迷宫或者下围棋,在这类问题里,机器人当前的每一步(左转或右转,下哪一格等)都会影响到后面的步骤,这就是增强式学习最基本的特点:解决有连续性相互影响的问题,过程中机器需要在连续性的很多步中选择正确的答案(却不知道最终结果是什么)。
机器之心:在对话和自然语言处理领域目前亟待解决的技术难题是哪些?
Emotech:绝大部分当前机器学习应用的挑战在于很多模型在特定的任务/领域可以取得非常出色的表现,但却很难应用到更广义的领域。对话,自然语言处理和语音识别也有这样的问题。当然具体来讲有很多难点需要更多的投入,比如说当多个用户用同一个设备时,需要特定的处理,再比如说,经常是即便语音识别已经达到非常高的水平,系统并不理解用户的意图或者失去对话中的当前状态;另外自然语言生成也是很有挑战的领域。
机器之心:bot 是目前很多科技巨头都看好的方向,认为是将来可以解除自然对话连接服务的一种全新的产品形态,你们对此怎么看?如果长期看好的话,目前制约 bot 发展的技术难点和产品难点各是什么?
Emotech:更全面地说,人工智能带来全新的产品形态,人工智能是这整个星球的趋势,而且我们坚信会是一个比移动互联网要更大的市场,因为它不光可以变革移动互联网上绝大部分的应用,还产生新的交互方式以及有物联网等基础;学术界已经积累了好几十年,工业界刚刚开始。技术难点方面前面的问题已经有提到了。
机器之心:团队中有些神经科学背景的专家,如何看待神经科学与人工智能之间的关系?
Emotech:我们可以看到很多人工智能上的进展是得到神经科学方面的启发,包括深度学习和一些关键计算机视觉方面的突破;人类拥有这个星球上最高级的智能系统,显然有很多方面值得研究,比如小孩的学习能力远比目前的计算机系统要先进;Olly 的核心是一个类脑人工智能引擎,使其情感化及高效学习;当然,如以上提到的:飞机并不需要像鸟一样扇动翅膀。
人工智能技术的成熟可能会带来一种全新的产品开发思路,而产品是一个综合学科,显然人工智能相关的产品其科研性会更突出,但依然是建立在满足用户需求的基础上。这部分等我们的产品出来后我们会比较系统地讲一次,这样能更形象一些。
©本文由机器之心原创,转载请联系本公众号获得授权。