阿里人工智能实验室?对,这个神秘机构即将登场

简介:
本文来自AI新媒体量子位(QbitAI)

下周三(7月5日)是个大日子。

上午百度要召开首届AI开发者大会,陆奇和李彦宏轮番上台。而下午,将有一场阿里人工智能实验室夏季新品首发,据猜测是发布阿里智能音箱。

等等,你可曾听说过“阿里人工智能实验室”?

这个名字对大部分人来说,可能都是陌生的。我们也感觉陌生,量子位就此向阿里询问,对方并没有给出明确的回答,仅表示原本是个保密部门……

阿里人工智能实验室拼图

这到底是个什么部门?

尽管阿里想要把悬念留到下周,但量子位还是对这个实验室充满好奇。于是顺着各种蛛丝马迹,我们尝试以拼图的方式还原这个机构。

直接说结论。

1、这是一个存在已经至少一年的机构。阿里人工智能实验室位于杭州,就在阿里巴巴的西溪园区,跟马云在一个园区办公。

在去年7月的一则招聘中,已经把这个机构描述为:“人工智能实验室专注于探索在大数据时代,利用人工智能技术,为用户提供智能化服务”。

2、阿里人工智能实验室,我们并不确定是否归属于阿里云旗下,但跟阿里云iDST(数据科学与技术研究院)是两个相互独立的部门。

这个实验室研究的领域包括深度学习、NLP、搜索/推荐算法、知识表示及推理问答系统、图像识别等,使用TensorFlow、Caffe等框架。

3、阿里人工智能实验室的业务,看起来很多元,涉足数个“应用平台”:包括AR管理平台、智能对话开放平台、未来酒店运营平台等。

4、要推出的产品看起来也不少,据推测可能会有移动端的图像处理App、AR/VR等视觉交互类的相关产品、语音交互的AI服务系统等。当然还包括即将发布的首款产品:阿里的智能音箱。

5、涉猎众多,这可能是为什么这个机构的英文名为:“Ali A.I. Labs”,结尾是个s,代表复数。如果不是写错了,那就只能说明不止一个实验室。

 阿里人工智能实验室的Logo

6、自产自销。上面已经指出,阿里人工智能实验室不只是一个研究机构,还负责把研究成果商品化。不止于此,这个实验室看起来还负责把产品和技术兜售出去。

这个实验室上个月开始招募“电商店铺运营专家”,这个岗位需要对“店铺销量达成率负责”。岗位要求第一条就是:三年以上天猫行业TOP10品牌商家运营相关岗位工作经历,并且要求“有天猫店铺装修经验”。

此外,他们还想把先关技术BD给行业里可合作的伙伴。据猜测,阿里人工智能实验室,至少也会推出一个语音类的开放平台,装入硬件厂商的产品中。

7、主要负责同志。据21世纪经济报道的信息显示,阿里人工智能实验室的负责人花名“浅雪”。根据此前公开的信息,她曾经担任淘宝首任产品经理,一淘网运营总监,阿里智能云总监等职务。

2015年4月2日,阿里成立智能生活事业部,进军智能生活领域。浅雪被任命为阿里智能生活事业部总经理。上一次关于这个事业部的集中报道,还是2016年双11时,官网列举的成功案例是一款海尔冰箱,一款长帝烤箱。

另外,阿里人工智能实验室的首席科学家是王刚。王刚今年3月加入阿里人工智能实验室,此前在新加坡南洋理工担任副教授(Associate Professor)。王刚2005年本科毕业于哈尔滨工业大学,2010年在伊利诺伊大学香槟分校获博士学位。

8、微博推广开始了。就在今天上午,量子位发现阿里巴巴人工智能实验室在微博上发出了第一条信息,而且还开通了广告推广~上个截图。

 阿里人工智能实验室微博推广

智能音箱大战ing

显而易见,阿里人工智能实验室要推出的,大概率是一个智能音箱。

在智能音箱这个赛道上,可谓是巨头云集。这个月初,苹果发布也发布了智能音箱HomePod,而更早之前亚马逊和Google都推出了同类产品。

来自eMarketer的报告显示,美国智能音箱市场Amazon Echo一家独大,占据70%的市场份额,Google Home的份额为23%。其余所有人分享5%。现在苹果也杀进来了,不知道这个格局未来会怎样发展。

实际上,当年Amazon Echo推出的时候并不受到重视,然而时至今日,这款产品累积销售额据称已达10亿美元,还有市场分析机构预测,到2020年Amazon的智能音箱销售额将达100亿美元,产品销量过亿。

调查也显示,美国市场各年龄段的用户,对于语音控制设备的使用量,也呈现出了明显的增加。这也是人工智能等相关技术发展的一个结果。

智能音箱看起来好像“并不复杂”,但实际上却需要语音识别、语义分析等诸多领域的人工智能技术在背后支撑。

再看国内市场,4月,百度联合小鱼在家正式推出家庭视频机器人“分身鱼”,主打家庭场景下的人机交互。6月,腾讯云宣布推出小微智能语音解决方案,并将联合硬件厂商推出智能音箱方面的产品。

再加上阿里,又是BAT齐聚,黑云压城城欲摧。

而且需要说明的是,这还没算上京东与讯飞联合推出的“叮咚音箱”,喜马拉雅发布的“小雅音箱”,以及小米随时升级网络音箱基础上的智能音箱产品。

此外,这个赛道上还有Rokid等卯足劲希望发力的创业公司。但我们想问,这些非巨头选手,会是中国智能音箱路上的炮灰吗?

创业者说

Rokid CEO祝铭明(Misa)认为谈这个还太早,他看这个行业最大的问题在“成熟”。这位Rokid创始人告诉量子位:“因为市场产品本身还在成熟,市场预估的话,可能最近一两年还不会特别大,音箱这个品类可能还需要耐心,大家现在以摸索的心态去看可能还会更实际些。”

对于已经陆续进场的BAT,祝铭明的回应是“拭目以待”,他说:“我个人不担心这种竞争。另外,这个市场需要大家伙们进来教育,现在市场早期,即便BAT全面发力,制造更大的声量,对这个产业也只会是好现象,竞争的本质还是产品品质和体验。”

 祝铭明

虽然Rokid在中国出发较早,但如果从销量和影响力来看,其所发布的“月石”和“若琪”,在国内还没有掀起智能音箱热潮。

与国外相比,但为什么更富市场吸引力和承载力的中国,却还迟迟未到百花争鸣的竞争状态呢?是真伪需求判断不同?还是软硬件等技术还需进一步解决?

祝铭明向量子位给出的答案是:时间,需要给全新产品品类进入市场一点时间。

他还透露了一些Rokid用户相关的情况:虽然整体规模还不便透露,但用户画像来看,老人、小孩、年轻人等各个年龄受众均已涵盖,全国各省均有覆盖,而且日活和月活数据也非常惊人。

“每天基本有一半以上的用户在使用,平均每天使用时长是1小时。月活几乎100%,而且值得一提的是复购率,自己回头再购和推荐朋友购买的比例接近80%。”

祝铭明也不认为技术方面存在森严壁垒,在核心硬件方面,智能手机供应链的成熟,已经为智能音箱所需要的供应埋好伏笔,各厂商剩下的竞争主要从工业设计、功能覆盖和产品打磨等方面展开。

更核心的竞争门槛在AI技术的实现,比如数据标注、小样本学习、语音识别、语义理解,以及现实使用环境中的抗干扰等。

对于Rokid这样的AI创业公司来说,面对巨头最不占优的方面可能就是数据量,不过祝铭明解释,现在数据量的问题已经不用再担心,因为利用统计模型、学习模型,可以打破过去依赖长时间人力积累建立起来的经验模型。

此外,即便不是用小样本数据,完成一个相对封闭场景下的数据运用,对于数据量的要求到中等规模也OK,小公司并不是没有机会。

当然,从祝铭明这样的从业者角度来看,即将爆发的智能音箱大战只是时间问题,因为这涉及到AI全面升级的体系认知。

或许这位Rokid创始人隐而未宣的雄心是打造AI时代的iPhone出来,把关设计、产品和用户体验,开放平台建立生态,成为无处不在的个性化AI的入口平台。

不过,这也是所有玩家的野心,包括即将登场的阿里人工智能实验室。

虽然阿里人工智能实验室颇为神秘,但似乎跟现已调整解散的阿里M工作室有些渊源传承。

据当时阿里M工作室负责人祝铭明透露,在3年前自己离职之际,向集团推荐的继任人选正是现任阿里人工智能实验室掌门“浅雪”,而目前该实验室还有自己不少M工作室的同事。

有意思的是,祝铭明3年前离职阿里做的事,现在即将面临阿里人工智能实验室的直接竞争。

【完】

本文作者:李根 李林
原文发布时间: 2017-06-30
相关文章
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里通义千问大语言模型在人工智能教育领域的应用探索
阿里通义千问,阿里集团的大型预训练语言模型,应用于AI教育,实现个性化教学、自适应学习系统和智能答疑。通过AIGC,它生成个性化内容,适应不同学生需求,优化教育资源配置,推动教育创新。在教育场景中,模型提供实时反馈,定制学习路径,促进教学质量提升。随着技术进步,AI在教育领域的应用将更加深入,但也需关注伦理与安全。
2013 1
|
1月前
|
人工智能 安全 算法
上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。
|
24天前
|
人工智能 编解码 BI
LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型
LEOPARD是由腾讯AI Lab西雅图实验室推出的视觉语言模型,专为处理含有大量文本的多图像任务设计。该模型通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,在多个基准测试中表现卓越,适用于自动化文档理解、教育和学术研究、商业智能和数据分析等多个应用场景。
39 2
LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型
|
27天前
|
人工智能 架构师 大数据
广西广电X阿里云:共同成立全媒体AI实验室!
广西广电X阿里云:共同成立全媒体AI实验室!
35 5
|
弹性计算 人工智能 自然语言处理
GPU实验室-通过GPU云服务器生成AI视频
自多态模型GPT-4发布后,AIGC(AI Generated Content,AI生成内容)时代正扑面而来,从单一的文字文本,演化到更丰富的图片、视频、音频、3D模型等。本文基于阿里云GPU服务器和文本生成视频模型,采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现文本生成视频功能。
|
7月前
|
存储 人工智能 文字识别
极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别
【2月更文挑战第17天】极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别
315 5
极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别
|
7月前
|
数据采集 人工智能 自然语言处理
上海AI实验室开源发布高质量语料“万卷CC”
【2月更文挑战第17天】上海AI实验室开源发布高质量语料“万卷CC”
156 2
上海AI实验室开源发布高质量语料“万卷CC”
|
人工智能 弹性计算 物联网
GPU实验室-部署Stable Diffusion玩转AI绘画
在本实验场景中,我们将向大家介绍如何基于 Stable Diffusion 实现文字到图片的生成,包括Stable Diffusion的安装和基本使用方法,以及使用Lora模型调整图片生成的风格。
|
人工智能 自然语言处理 并行计算
彻底开源,免费商用,上海AI实验室把大模型门槛打下来
彻底开源,免费商用,上海AI实验室把大模型门槛打下来
224 0
|
机器学习/深度学习 人工智能 自然语言处理
跟着阿里训练营视频课程学习人工智能技术遇到的模型网络概念问题
参加人像卡通画训练营视频课程记录的一些概念介绍内容
154 0