StartDT AI Lab | 视觉智能引擎——AI识货赋能商品数字化

简介: 视觉智能引擎作为奇点云AI落地的第一步,在商品数字化方面发挥着主要作用。本文将着重介绍奇点云的人工智能技术是如何从“货”的维度赋能零售商业的。


自零售领域近些年围绕转型升级建设性地提出了以“人、货、场”三核心为基础的新零售蓝图之后,各方新技术蜂拥在零售的各型场景中角力。在之前的分享中,我们主要介绍了奇点云是如何通过人工智能技术,从“人”的维度切入零售场景的。而本文将着重介绍奇点云的人工智能技术是如何从“货”的维度赋能零售商业的。

视觉智能引擎作为奇点云AI落地的第一步,在商品数字化方面发挥着主要作用。而从视觉角度来说,“货”的形态差异相较于“人”来说有了显著增加。不同的垂直行业为顺应市场需求所开发的产品,无论在产品功能还是形态上都千差万别,甚至同类型产品也会产生出不同的形态以顺应差异化的细分需求。这对视觉智能引擎提出了新的挑战,也激发出了StartDT AI Lab更大的技术突破。下面从奇点云已经商业落地的场景中选了几个比较有代表性的行业场景来展示StartDT AI Lab已取得的技术突破。

AI识货赋能服饰行业

我们在17年率先推出服装识别技术,结合产品——奇点魔镜实现落地。在这个场景中,用户站在奇点魔镜前站定几秒后,奇点魔镜首先将对用户的穿着进行分割理解,从中分离出T恤、风衣、夹克、牛仔裤等各种类型的服饰,然后通过对单品服饰的分析,例如T恤,我们可以对其抽取特征,分析出T恤的风格、袖长、版型等属性,最后在我们自建的百万级服饰商品库中,使用推荐算法为用户推荐相似的、配套的商品,从而达到引流客户、智能导购的效果。
_

在这个链路中,我们当时碰到的主要问题和解决方案:

1.获取用户准确的衣着信息并获取特征时,像T恤、短裤这样上下装明显的衣着较容易获取,但像连衣裙、风衣类较长的衣着却较难处理。

我们通过收集大量数据、清洗打标、完善数据集,并使用级连方法,先对服饰一级标签进行检测分析,再进行二次处理,从而提高了分割效果。

2.服饰属性多样且没有统一的标准,如何快速同时判断成为难题。

我们将属性的分类器各自独立互不影响,使用特征作为输入,减少了重复运算,另外我们将分类器同时接在Graph中,使整体过程End-to-End,快速有效。

3.大规模检索:当数据库较大时,检索速度慢,无法快速响应。

我们将比对数据库部署在分布式集群上,实现了特征比对层面的map-reduce,使我们在应对各种级别的比对时游刃有余。

AI识货赋能快消饮品行业

我们在快消饮品行业已有近两年的探索历史。各式各样的饮品——包括矿泉水、碳酸饮料、果汁、啤酒、白酒等都可以在奇点魔柜中售卖。我们通过自研的深度学习算法、数据采样方法,配合我们定制化的硬件配置,实现了在商用场景中99%以上的识别准确率。我们将货损率控制在1%以内,低于快消饮品行业平均货损水平。此外,我们在不到1平米的占地空间上实现了极高的坪占比,单柜单月零售额可达千元级别,却仅需少量的维护工作。

_

在正式商用的背后,StartDT AI Lab主要的contribution有以下几点:

No.1 快速有效的小物体检测算法

和大多数场景不同,我们的检测目标往往是最小边接近16像素的小目标,且在一张图上有相当多的目标。我们通过自适应anchor的方法,使先验anchor更加准确;此外我们通过一种特征增强算法,使细节特征得以在深度网络中尽可能减少损失,从而避免了因特征过少带来的低分值检测结果不稳定的问题。此外我们还自研了一种自蒸馏方法,在不增加参数的情况下提升了模型准确率,从而达到了商用水准。

No.2 与度量学习结合的识别技术

度量学习在过去的几年中被广泛使用在人脸识别模型上,并取得了非常不错的效果。我们将其引入商品识别,结合经典的神经网络方法,使识别结果更加准确可靠;此外模型还可输出可比对特征,支持特征比对方式出结果,支持不同类间相似比较,从而在选品层面就避免了相似商品同时售卖无法识别的问题。

No.3 小数据集增强

我们的数据集相对使用场景,其实是一个小数据集。如何使用小数据集在大数据场景下获得商用级准确度?我们自研了一种mix方法,使检测模型获得了非常高的召回率;此外我们还使用了GAN,在训练分类器的过程中同时训练生成器,再拿生成结果同时训练分类器,使分类器训练更充分,更平滑。

在生鲜/药品等垂直领域,我们也敢于摸索和尝试,发挥自有深度学习算法和采样方法的优势,结合自研的硬件优点,首创能将繁复多类的生鲜不受类别影响的智能货柜。众所周知,在垂直领域中,同一sku的外观变化多样,适配成本高。我们通过特定产品设计,完美支持各类蔬菜水果等生鲜,准确率更是可以做到近乎100%。让顾客不受限于菜市场/药房等特殊场地的限制同时,更可以发挥无人货柜的完美优势——不受时间限制。

_
_
_
(从上至下为药品类识别、生鲜类识别、订单展示)

StartDT AI Lab在黑暗中探索的收获与创新:

No.1 新颖的深度学习式场景思考

为了摆脱生鲜场景下,各种形状和尺寸带来的异同和难以兼容,以及客户快速上新的切实需求,我们在场景落地的实际道路上,结合商品的特性、产品的优势和深度学习算法的原理,给奇形怪状的生鲜产品进行特殊的包装,该方案解决了生鲜产品之间的差异性,并能支持客户快速上新。

No.2 独具创新特色的数据增广

光有新颖的方案设计还不足以让深度学习在一个实际场景中完美落地,准确率是客户第一要素,数据是深度学习的资本。StartDT AI Lab在深入分析了生鲜和药品等垂直领域的数据特性和算法性能之后,创新性地在采样数据集上进行数据增广,让准确率近乎完美,诠释了什么是将深度学习进行落地的概念。

从以上案例中,呈现了奇点云在“货”的数字化探索,虽然还是比较初步的商品数字化阶段,但也通过AI技术首次实现了商品售卖周期内的全链路数字化跟踪。并在此基础上实现了零售前端成本削减,提高了用户调研自动化的效率。为了让商业更智能,StartDT AI Lab将继续前行,请持续关注~

目录
相关文章
|
5月前
|
人工智能 新制造 云栖大会
TsingtaoAI亮相云栖大会,AI大模型赋能传统制造业焕新升级
2025年9月24日,杭州云栖小镇,2025云栖大会盛大开幕。作为全球AI技术与产业融合的重要平台,本届大会以“AI驱动产业变革”为主题,集中展示大模型技术在各领域的创新应用。 其中,由西湖区商务局牵头组织的“AI大模型应用与产业融合”专场论坛成为大会亮点之一,吸引了来自政府、企业及投资机构的百余名代表参与。 在论坛上,TsingtaoAI作为制造业智能化转型的代表企业,分享了在具身智能-制造企业的AI应用实践。
374 1
|
5月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
356 7
|
6月前
|
机器学习/深度学习 人工智能 编解码
古籍版面分析新SOTA:HisDoc-DETR如何助力AI赋能古籍数字化难题
HisDoc-DETR是面向历史文献版面分析的创新模型,融合语义学习与多尺度特征融合,有效应对古籍中复杂布局、稀疏文字与破损模糊等挑战,实现高精度元素识别与结构解析,推动文化遗产数字化与学术研究发展。
|
6月前
|
人工智能 异构计算
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
|
6月前
|
人工智能 搜索推荐 大数据
AI赋能销售管理:珍客CRM引领销售效能革新,解锁高效增长
在数字化浪潮下,以AI技术为核心,珍客CRM融合智能获客、跟进、客户管理与数据复盘,赋能企业实现销售全流程智能化升级,助力突破增长瓶颈,引领AI时代销售新变革。
|
6月前
|
存储 人工智能 关系型数据库
阿里云AnalyticDB for PostgreSQL 入选VLDB 2025:统一架构破局HTAP,Beam+Laser引擎赋能Data+AI融合新范式
在数据驱动与人工智能深度融合的时代,企业对数据仓库的需求早已超越“查得快”这一基础能力。面对传统数仓挑战,阿里云瑶池数据库AnalyticDB for PostgreSQL(简称ADB-PG)创新性地构建了统一架构下的Shared-Nothing与Shared-Storage双模融合体系,并自主研发Beam混合存储引擎与Laser向量化执行引擎,全面解决HTAP场景下性能、弹性、成本与实时性的矛盾。 近日,相关研究成果发表于在英国伦敦召开的数据库领域顶级会议 VLDB 2025,标志着中国自研云数仓技术再次登上国际舞台。
698 0
|
5月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1356 55
|
6月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1291 59
|
5月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
655 30

热门文章

最新文章