阿里云开放阿里巴巴三大核心AI:图像搜索、语音自学习、机器翻译

简介: 7月18日,阿里云正式发布了三款人工智能产品:图像搜索、智能语音自学习平台以及机器翻译,三款产品由阿里云与阿里巴巴机器智能技术实验室联合自主研发,旨在为不同行业的用户提供业界领先的人工智能解决方案,进一步推动产业AI的落地。

7月18日,阿里云正式发布了三款人工智能产品:图像搜索、智能语音自学习平台以及机器翻译,三款产品由阿里云与阿里巴巴机器智能技术实验室联合自主研发,旨在为不同行业的用户提供业界领先的人工智能解决方案,进一步推动产业AI的落地。

众所周知,计算机视觉、语音交互以及NLP是人工智能的三大核心技术,然而市面上的人工智能解决方案鱼龙混杂,此次发布的三款产品已经承受了阿里巴巴集团内部复杂业务场景的挑战,为行业客户提供了绝佳的选择。

拍立淘同款:图像搜索正式商业化

此次推出的图像搜索是以深度学习和大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的智能图像搜索产品。图像搜索服务在基于图像识别技术基础上,结合不同行业应用和业务场景,帮助用户实现相同或相似图片的搜索。

与通用搜索主要依靠字节不同,图像搜索被主要定义为“以图搜图”,可支持以下两大功能:

1.商品图片搜索,通过输入商品图片,可以在商品库中准确地找到图片中商品的同款或者相似款,返回对应的商品信息;

2.通用图片搜索,通过输入具有相同元素或主体内容的图片,在海量图片库中查找相似或相同的图片。
1

据了解,该方案包含了深度学习、图像识别、支持百亿级数据的向量检索引擎等方面的最新前沿研究成果。

值得一提的是,淘宝拍立淘功能背后采用的就是此图像搜索技术,并且完美的支持了每天超过千万的UV。在拍立淘数据库中有超过 10 亿个商品,学界熟知的 ImageNet 数据库也只保存了 1500 万张照片,而拍立淘每一天上传的图片就超过了这一数字。

智能语音自学习平台:0基础训练人工智能模型

智能语音自学习平台是一键式语音智能自助优化方案,突破了语音识别优化依赖于语音供应商专家服务的局限,可以让不懂技术的人员从此也可以快速显著提升自己业务的识别准确率满足业务需求。

传统的语音识别优化依赖于语音识别AI科学家来进行,对于很多智能项目的实施而言,这种方式存在几大难题:首先,项目进展受限于集中在语音供应商的AI科学家资源;其次,后续项目效果优化周期数以周记甚至数以月记,人工智能不再智能。

阿里巴巴机器智能技术实验室语音智能高级专家周躜表示,“自学习平台的目的是向没有专业知识背景的人员提供低门槛甚至零门槛的智能语音优化平台,使得我们的客户摆脱对AI科学家的依赖。”
2

据悉,相关技术已经在智能政务、智能 导航、智能催收、智能音响、智能家居、机器人及自动驾驶等领域都有广泛应用。在今年的云栖大会武汉峰会上,基于相关技术训练的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一技术的自动售票机也已在上海地铁“上岗”。

机器翻译:单天翻译词超千亿

阿里云机器翻译提供多类的翻译和语言服务,具有高性能高并发服务、多模态服务等能力,可帮助国际化企业提升业务价值。

据了解,上述机器翻译平台已经沉淀了优质的跨境语料数据库,充分利用先进的机器翻译算法技术和海量的数据资源,深度打磨机器翻译质量和产品体验,并积极拓展机器翻译业务的产品形态,将各项机器翻译技术产品化,如语音翻译、会场同传、实时沟通等新产品和服务形态。

官方信息显示,机器翻译在阿里巴巴内部可以达到每天翻译出几十亿量级的产品信息,每天的线上翻译请求到达数亿次,在双11时每秒钟的翻译请求大概有几万次,每天翻译的词语个数超过2000亿,而根据Google 2016年披露的数据,其每天翻译的词语个数大概是1400多亿。

3

目前该技术已为阿里巴巴集团十几条业务线提供机器翻译和本地化支持,覆盖了Alibaba.com 、 AliExpress 、 Lazada 、钉钉、阿里云、优酷、支付宝、菜鸟、天猫精灵、高德、飞猪等众多产品。

最全面的人工智能平台

从行业大趋势来看,云计算将会是AI最好的落地平台。阿里云一直致力于推动产业AI的落地,并且拥有从底层硬件基础设施到行业解决方案的丰富人工智能产品家族,是国内最全的人工智能解决方案商。

从2015年开始,阿里云推出了一系列人工智能产品,例如基于CPU、GPU、FPGA等异构计算平台,面向开发者的机器学习PAI平台,以及语音识别、图像识别、视觉识别等130多款细分产品(印刷文字识别、人脸识别、图像识别、智能语音交互和自然语言处理等),可以服务300多个不同行业的应用场景。
4

除上述解决方案之外,阿里云的ET大脑家族也在不断完善。目前,ET大脑已经覆盖了城市、工业、零售、金融、汽车、家庭等多个场景。其中,ET工业大脑已经帮助工业制造企业创造利润数十亿,ET城市大脑支持了杭州、澳门、吉隆坡等城市进行智能化升级。

了解更多AI产品请戳:https://promotion.aliyun.com/ntms/act/aiproduct.html?spm=a2c4e.11154000.rtdmain.1.319d6c12HQSW25

相关文章
|
4月前
|
人工智能 文字识别 监控
|
4月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3037 166
|
4月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
4月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
4月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
705 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
4月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
6月前
|
JSON 缓存 供应链
1688图片搜索API秘籍!轻松获取相似商品数据
1688图片搜索API基于图像识别技术,支持通过上传商品图片搜索同款或相似商品,适用于电商选品、供应链管理等场景。提供多种搜索模式与结果过滤条件,支持Python等开发语言,提升采购效率。
|
9月前
|
机器学习/深度学习 JSON 算法
京东拍立淘图片搜索 API 接入实践:从图像识别到商品匹配的技术实现
京东拍立淘图片搜索 API 是基于先进图像识别技术的购物搜索接口,支持通过上传图片、URL 或拍摄实物搜索相似商品。它利用机器学习和大数据分析,精准匹配商品特征,提供高效、便捷的搜索体验。接口覆盖京东海量商品资源,不仅支持外观、颜色等多维度比对,还结合用户行为数据实现智能推荐。请求参数包括图片 URL 或 Base64 编码,返回 JSON 格式的商品信息,如 ID、价格、链接等,助力消费者快速找到心仪商品,满足个性化需求。
606 18
|
10月前
|
搜索推荐 数据挖掘 API
深入研究:京东图片搜索商品API详解
京东图片搜索商品API简介:在电商快速发展的背景下,用户需求日益多样化。为提升购物体验,京东推出图片搜索商品API,通过上传商品图片(如实物图或宣传图),利用图像识别技术匹配京东商品库,返回相似商品的信息(如名称、价格、销量等)。该API采用HTTP POST请求方式,支持JPEG、PNG等常见图片格式,并可设置分类范围和结果数量限制等可选参数,助力开发者实现更精准的商品搜索,优化用户体验,同时为数据分析与个性化推荐提供支持。本文详细介绍了其功能、使用方法及Python请求示例。

热门文章

最新文章