7月18日,阿里云正式发布了三款人工智能产品:图像搜索、智能语音自学习平台以及机器翻译,三款产品由阿里云与阿里巴巴机器智能技术实验室联合自主研发,旨在为不同行业的用户提供业界领先的人工智能解决方案,进一步推动产业AI的落地。
众所周知,计算机视觉、语音交互以及NLP是人工智能的三大核心技术,然而市面上的人工智能解决方案鱼龙混杂,此次发布的三款产品已经承受了阿里巴巴集团内部复杂业务场景的挑战,为行业客户提供了绝佳的选择。
拍立淘同款:图像搜索正式商业化
此次推出的图像搜索是以深度学习和大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的智能图像搜索产品。图像搜索服务在基于图像识别技术基础上,结合不同行业应用和业务场景,帮助用户实现相同或相似图片的搜索。
与通用搜索主要依靠字节不同,图像搜索被主要定义为“以图搜图”,可支持以下两大功能:
1.商品图片搜索,通过输入商品图片,可以在商品库中准确地找到图片中商品的同款或者相似款,返回对应的商品信息;
2.通用图片搜索,通过输入具有相同元素或主体内容的图片,在海量图片库中查找相似或相同的图片。
据了解,该方案包含了深度学习、图像识别、支持百亿级数据的向量检索引擎等方面的最新前沿研究成果。
值得一提的是,淘宝拍立淘功能背后采用的就是此图像搜索技术,并且完美的支持了每天超过千万的UV。在拍立淘数据库中有超过 10 亿个商品,学界熟知的 ImageNet 数据库也只保存了 1500 万张照片,而拍立淘每一天上传的图片就超过了这一数字。
智能语音自学习平台:0基础训练人工智能模型
智能语音自学习平台是一键式语音智能自助优化方案,突破了语音识别优化依赖于语音供应商专家服务的局限,可以让不懂技术的人员从此也可以快速显著提升自己业务的识别准确率满足业务需求。
传统的语音识别优化依赖于语音识别AI科学家来进行,对于很多智能项目的实施而言,这种方式存在几大难题:首先,项目进展受限于集中在语音供应商的AI科学家资源;其次,后续项目效果优化周期数以周记甚至数以月记,人工智能不再智能。
阿里巴巴机器智能技术实验室语音智能高级专家周躜表示,“自学习平台的目的是向没有专业知识背景的人员提供低门槛甚至零门槛的智能语音优化平台,使得我们的客户摆脱对AI科学家的依赖。”
据悉,相关技术已经在智能政务、智能导航、智能催收、智能音响、智能家居、机器人及自动驾驶等领域都有广泛应用。在今年的云栖大会武汉峰会上,基于相关技术训练的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一技术的自动售票机也已在上海地铁“上岗”。
机器翻译:单天翻译词超千亿
阿里云机器翻译提供多类的翻译和语言服务,具有高性能高并发服务、多模态服务等能力,可帮助国际化企业提升业务价值。
据了解,上述机器翻译平台已经沉淀了优质的跨境语料数据库,充分利用先进的机器翻译算法技术和海量的数据资源,深度打磨机器翻译质量和产品体验,并积极拓展机器翻译业务的产品形态,将各项机器翻译技术产品化,如语音翻译、会场同传、实时沟通等新产品和服务形态。
官方信息显示,机器翻译在阿里巴巴内部可以达到每天翻译出几十亿量级的产品信息,每天的线上翻译请求到达数亿次,在双11时每秒钟的翻译请求大概有几万次,每天翻译的词语个数超过2000亿,而根据Google 2016年披露的数据,其每天翻译的词语个数大概是1400多亿。
目前该技术已为阿里巴巴集团十几条业务线提供机器翻译和本地化支持,覆盖了Alibaba.com 、 AliExpress 、 Lazada 、钉钉、阿里云、优酷、支付宝、菜鸟、天猫精灵、高德、飞猪等众多产品。
最全面的人工智能平台
从行业大趋势来看,云计算将会是AI最好的落地平台。阿里云一直致力于推动产业AI的落地,并且拥有从底层硬件基础设施到行业解决方案的丰富人工智能产品家族,是国内最全的人工智能解决方案商。
从2015年开始,阿里云推出了一系列人工智能产品,例如基于CPU、GPU、FPGA等异构计算平台,面向开发者的机器学习PAI平台,以及语音识别、图像识别、视觉识别等130多款细分产品(印刷文字识别、人脸识别、图像识别、智能语音交互和自然语言处理等),可以服务300多个不同行业的应用场景。
除上述解决方案之外,阿里云的ET大脑家族也在不断完善。目前,ET大脑已经覆盖了城市、工业、零售、金融、汽车、家庭等多个场景。其中,ET工业大脑已经帮助工业制造企业创造利润数十亿,ET城市大脑支持了杭州、澳门、吉隆坡等城市进行智能化升级。