第15年双11,技术创新开启 AI 淘宝新起点

简介: 第15年双11,技术创新开启 AI 淘宝新起点




天猫双11走到第15个年头,遇上了“变革”与“新生”2个关键词。生成式AI等科技变革和消费行为习惯变迁的时代大背景下,淘宝正在变为新的“AI淘宝”。

在今年的天猫双11,商家和消费者们多了一位“AI助手”。淘宝天猫平台上商家在双11准备期及开卖期,调用AI次数已超过15亿次。与之对应,淘宝问问的累计体验人次已经超1000万,其中高活跃人群日均提问数超8次,单一用户最多提问数超4000次。我们在“用户为先、生态繁荣、科技驱动”三大战略指引下,让技术与业务实现更深入的融合,给消费者带来更好的体验,帮助商家实现更好的经营,也让技术自身的发展迎来新机会。


用户为先,让消费者好玩好买的体验技术


“用户为先”是被放在首位的战略指导,而技术在消费者的体验价值中发挥着举足轻重的作用。我们常说,当一项技术逐渐“看不见”的时候,就是这项技术真正走向成熟的时候。在第15个天猫双11的当下,与消费者有关的端侧、音视频、弱网体验、认知计算与知识图谱等技术已经无声无息地浸润到了消费生活。


假设一位消费者在双11下载和打开手机淘宝,首先能感受到的就是更“轻”和更“快”的淘宝。今年我们在保证不影响现有业务指标和用户体验,以及保障手淘整体稳定性质量前提下,通过建设一套完整的客户端原生远端化、动态化能力基建等技术手段,让手淘APP“占地面积”更小,内容依然同样的丰富。手淘Android安装包体更是瘦身40%+,实现2018历史以来的最小包体。在更“快”方面,我们实现了基础中间件和架构升级,双端启动性能取得了近年来最大的提升,大部分设备打开App耗时减少40%+,通过H3优化/多通道/MPQUIC/ZSTD等技术,弱网下的体验也非常优异,消费者在电梯、地下车库、隧道等网络不好的地方也依然可以逛淘宝。


当消费者对自己想要购买的商品还存有疑问时,可以使用今年9月开始内测的创新智能 AI 产品“淘宝问问”。问问通过大模型对自然语言表达和专业电商知识的学习,在搜索编排框架的基础上集成 XLangChain 框架构建大语言工程链路,能更加精准地理解我们想要什么,进行自然流畅的回复。同时针对我们的反馈持续推进对话进程,实现对话式搜索。问问能够覆盖用户在淘宝购物过程中的前中后各个环节,包括商品推荐、购物决策、品牌知识、导购陪伴等,实现全流程的智能辅助,并将帮助淘宝更好地理解和满足用户每日亿级别的长尾需求,激发新的消费生活相关的需求。不管你有什么问题,问问“问问”就好了。


我是你的“淘宝问问”,除了导购还可以解答生活常识哦~


随着问问推荐的商品,消费者点击商品详情,能感受到详情页的瞬开。今年我们从端到端视角出发,通过导航预加载、Mtop流式分段返回、业务域并行化等手段来提升详情页面的加载性能,实现详情全渠道无差别瞬开体验。通过适用信息流复杂业务场景的预请求策略、容器框架升级及底层优化等手段,从信息流点击卡片进入NewDetail也可以丝滑切换,交互流畅,为用户节省出更多逛商品和看视频的时间。


当消费者点开商家直播间,映入眼帘的会是1080p高清画面。新版手淘完成了1080p高清化升级,通过音视频底层的编码压缩、视频增强、播放侧自适应切流等全面升级改造,配合全链路内容清晰度监控,使得1080p高清画质最大化覆盖了淘宝直播、逛逛的视频场景。淘宝直播和逛逛全屏页的1080p观看占比从10%提高到60%以上,播放卡顿降低50%以上,消费者可以获得更加沉浸的购物体验。不少商家发来反馈“质感提升好多”“脸上没有马赛克了”“画面亮度均匀还很流畅”。此外,我们自研S266编解码器,将新一代H.266/VVC标准首次在手淘逛逛落地,编码效率对比H.265提升30%以上。新一代编码标准的落地,也将为淘宝迈向更高消费体验打下坚实的基础。


S266同等码率下,脸部和头发更清晰,项链更有光泽

看完直播商品讲解,消费者将心仪的商品添加进购物车,如果未达满减金额,可以使用“购物车一键凑单”功能。这个功能核心是通过算法牵引,采用多trigger注意力网络来构建购物车即时勾选商品与用户行为序列的相关度,让凑单商品会比“猜你喜欢”更精准的满足我们当下的需求,并打通购物车、详情、信息流的数据壁垒,给用户提供了沉浸式凑单场域。


最后,虽然消费者看不到订单生成后的交易履约过程,但是我们基于用户和商品维度特征预测订单流转概率,再基于仓内产能进行控容有序下发,每天能够为近百万用户订单决策下发策略,这种智能履约算法能够让消费者更快地收到自己的商品,也能帮助商家有效节约物流成本。


在淘宝,消费者的的每一次点击,商品所抵达的每一个节点,背后都有一套庞大而复杂的系统在提供支撑,而在系统之后,是秉承着“用户为先”的理念的技术人,努力地解决问题,创造扎扎实实的价值,给消费者带去更好的线上体验。


生态繁荣,让商家经营简单高效的开放技术


淘宝是一个人来人往、丰富有趣的街区,未来五年将汇聚上千万商家、上亿创作者和各种服务商。淘天集团抱持着开放、普惠和共赢的心态,承诺未来五年内将实现商家运营工具的全面智能化,在创意生产、决策分析、投放效果三个维度发力,最终为商家降本、提效。在这背后,AI赋能下的商家内容能力和经营能力都将获得极大提升,而AI技术必将带来商家与平台关系的重构。


实现AI与电商的有机结合,一定能给品牌商家带来万亿级的生意爆发,在今年双11中,淘宝商家智能经营工具表现亮眼。淘宝通过AI能力的整合,升级了多个商家经营场景。集成了属性回填、标题生成等多个AI能力的AI发品工具,上线不足半月即为女装服饰商家提供了10w+次AI发品服务,发品时长较传统发品降低25%,后续AI发品、AI开店等AI+场景服务,将持续覆盖更多行业和经营场景。除了节点式AI工具和AI+场景的服务升级,我们基于大语言模型技术研发了中心化的电商经营Copilot,开启内测后已经为数万商家提供了经营知识问答、经营工具调用、文案生成等多种经营辅助能力,目前已经为商家经营提效超50w次。


此外,我们基于AIGC图像生成技术,构建电商域生图大模型,商品图像生成和编辑能够瞬间完成,自上线以来,累计为数以百万的商家提供近千万次智能图片服务。其中,基于OutPainting图像延展技术做的尺寸服务,商家采纳率超97%,彻底解决了图片改尺寸这个困扰商家多年的痛点。通过SAM图像分割与ControlNet可控生成技术提供的主图生成服务,日均为商家生成超10w张商品图片,帮助商家降低制图成本2个数量级。所有图片工具完成了商家开店、发品、营销等主要经营场景的全覆盖,能够随时随地为商家解决图片问题。有商家发来反馈表示,“这个功能非常实用,也是大势所趋,在模特和场景上尽可能降低成本,才能更好的把利润投入到产品开发和升级上去,感谢平台技术的普惠。”

商家使用AI工具智能开店


而更早上线的淘天营销引擎阿里妈妈所推出的“万相实验室”,更加聚焦在通过生成式AI技术帮助商家降低优质创意图制作成本、加快生产速度、提升投放效率。万相实验室结合营销创意业务背景,快速建立基于用户交互和自动化的创意图像生成解决方案;全流程覆盖自动化抠图、基础文生图模型、控制生成算法、后处理修复、光线融合超分等模型化能力。万相实验室创新地提出Masked Controlnet带来更强生成控制能力,业界首个人像姿态生成修复方案有效降低坏图比例、优化属性绑定和布局生成算法提升多语义准确性,带来生成效果的稳步提升。在万相实验室工具产品中,累计服务超10万商家,生产效率提升5倍,同时在大规模广告投放系统中给商家带来稳定的CTR提升。作为创意素材生成工具,进一步结合商家一站式营销投放系统——阿里妈妈万相台无界版,帮助商家更好地实现简单经营。

今年双11是新品牌、新商家、中小商家参与最多的一届,而技术为中小商家们提供的工具可以快速对齐一些大商家的能力,极大提升商家运营和投放广告的效能。技术创新将不断拓展商业的更多可能性,真正实现平台上的“生态繁荣”。


科技驱动,让电商开启新可能的创新技术


支撑消费者好买好玩和商家经营简单高效的坚实底座,就是我们的创新技术。早在今年618的商家大会上,我们已对外确定“变革生新”的三个方向,即升级新场景、新生态和新技术。而在这届双11大考中,除了“站在C位”的AI创新技术,我们的服务器、引擎、智能计算资源等背后的技术力量,也在不断迭代和突破,让创新不受限制,拓展想象空间。


去年我们探索沉浸式购物体验,自主研发和高度定制引擎能力和研发框架,今年我们的3D引擎(AceNNR)已支撑了几十家供应商,2w+商品模型、30+场景的规模化生产,持续打造XR极致技术。今年的一系列创新AI技术让淘宝站在了新的起点之上,数百亿级历史和在线商品、数百亿级粉丝会员关系、每天数百亿级商品浏览,超大规模交易和海量消费评价……淘宝20年的沉淀,支撑起我们尝鲜AI的底气,也实现了AI技术在多种业务场景的试用。


不止于大家已经耳熟能详的“淘宝问问”和“千牛商家经营AI工具”,我们基于家居家装生态和规模化行业数据,已上线面向C端的AI装修产品“真能造”,用户上传空间照片后可免费生成10种风格的装修设计图。我们采用扩散模型融合商品多模态信息的生成网络,并融合用户图身份和姿态信息,上线“淘宝试衣”,能够为用户快速生成真实、自然的试衣效果,获得更加个性化的购前决策引导。还有解决用户爱宠数字化难题的AI萌宠产品,利用AIGC新技术为用户的爱宠制作宠物数字分身,可以在线上进行风格化、拟人化、日常打卡、全球旅行等动作,还可以搭配服饰、食品和其他商品,给用户带来更丰富的线上互动乐趣。客服工作台也有了自己的AI助手,基于大模型能力为客服小二提供最佳话术回复,提升客服小二的服务效率与品质。


淘宝AI应用:“真能造”“淘宝试衣”“我的萌宠”


AI+电商的背后是更为扎实的工作。智能计算资源提供高性能、高弹性异构算力服务,支持万张GPU规模的资源弹性,支持AI+HPC场景算力的统一分配和融合调度,无缝连接。采用高效的池化异构算力调度技术,确保每一份算力投入都能得到充分利用,应对大模型和大规模工程仿真的算力需求,让创新不受算力限制,在淘宝天猫率先落地。而“云上双11”的概念也更为成熟,搭载阿里云自研服务器的ECS实例支持集团业务上云,混部场景规模化落地近万台服务器,支持双11大促规模化交易,为公共云客户上云提供了最佳实践。



结语


第15年天猫双11,我们依然围绕体验升级的目标,用技术创新不断探索数字时代下最理想的消费方式和生活方式。淘宝天猫本身就是技术创新的结果,在AI时代开启之际,在“用户为先、生态繁荣、科技驱动”的三大战略指引下,我们会更坚定地做长期投入,保持持续的技术创新和技术突破,让生活更加美好。

相关文章
|
6天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
38 3
|
16天前
|
人工智能 搜索推荐 安全
AI技术在医疗领域的应用与挑战
【10月更文挑战第27天】 本文探讨了人工智能(AI)在医疗领域的应用,包括疾病诊断、药物研发和患者管理等方面。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题和技术局限性等。通过对这些方面的深入分析,我们可以更好地理解AI在医疗领域的潜力和发展方向。
119 59
|
5天前
|
人工智能 文字识别 运维
AI多模态的5大核心关键技术,让高端制造实现智能化管理
结合大模型应用场景,通过AI技术解析高端制造业的复杂设备与文档数据,自动化地将大型零件、机械图纸、操作手册等文档结构化。核心技术包括版面识别、表格抽取、要素抽取和文档抽取,实现信息的系统化管理和高效查询,大幅提升设备维护和生产管理的效率。
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
66 11
|
10天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
55 4
|
9天前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
14天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗健康领域的应用与挑战####
本文旨在探讨人工智能(AI)技术在医疗健康领域的创新应用及其面临的主要挑战。通过深入分析AI如何助力疾病诊断、治疗方案优化、患者管理及药物研发,本文揭示了AI技术在提升医疗服务质量、效率和可及性方面的巨大潜力。同时,文章也指出了数据隐私、伦理道德、技术局限性等关键问题,并提出了相应的解决策略和未来发展方向。本文为医疗从业者、研究者及政策制定者提供了对AI医疗技术的全面理解,促进了跨学科合作与创新。 ####
|
12天前
|
人工智能 算法
AI技术在医疗领域的应用及其挑战
【10月更文挑战第31天】本文将探讨AI技术在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念开始,然后详细介绍其在医疗领域的应用,包括疾病诊断、药物研发、患者护理等方面。最后,我们将讨论AI技术在医疗领域面临的挑战,如数据隐私、算法偏见等问题。
|
12天前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
医疗行业的语音识别技术解析:AI多模态能力平台的应用与架构
AI多模态能力平台通过语音识别技术,实现实时转录医患对话,自动生成结构化数据,提高医疗效率。平台具备强大的环境降噪、语音分离及自然语言处理能力,支持与医院系统无缝集成,广泛应用于门诊记录、多学科会诊和急诊场景,显著提升工作效率和数据准确性。

热门文章

最新文章