今天!阿里巴巴新零售内容AI平台创新与实践 | CNCC技术论坛

简介: 精彩内容将在10月23日(今天)13:30-16:00线上同步直播。

中国计算机学会 (CCF) 主办的「2020中国计算机大会」(简称:CNCC)将于10月22-24日在杭州未来科技城学术交流中心举办。

10月23日下午,阿里巴巴淘系技术部将在CNCC2020和大家分享阿里巴巴新零售内容AI平台创新与实践。

image.png

image.png

随着4G的普及和5G的推出,内容消费的诉求越来越受到人们的重视。2019年互联网趋势报告指出在移动互联网行业整体增速放缓的大背景下,短视频行业异军突起,成为“行业黑洞”抢夺用户时间,尽管移动互联网人口红利见顶,新的增长点难以寻觅,但中国短视频人均使用时长及头部短视频平台日均活跃用户均持续增长。

在淘宝,短视频业务一直以来都是非常重要的业务,是淘宝app从单一的商品导购app走向商品导购+内容消费的多元化app的关键所在。现如今淘宝每年新增内容数达数十亿,其中视频数占比持续提升,预计到2022年视频的占比会超过50%。如何对规模如此庞大的视频进行内容化理解,高效赋能视频运营和个性化分发变得极为关键。

因此,针对视频内容理解技术,我们将重点构建一个面向视频的层次化、精细的标签体系和算法,为新生产的视频提供冷启动能力,提升分发的效率,另一方面构建视觉内容和文本语义之间的跨模态检索算法,根据用户的检索,提供更加优质的视频内容,提高用户的消费体验。

下面橙子就来和大家揭晓——本场论坛的演讲嘉宾和议题。

淘宝直播端上窄带高清技术

演讲时间:13:50-14:20

演讲嘉宾:王立波(庄恕),阿里巴巴淘系技术部高级算法专家,毕业于上海交通大学数学系,现为淘宝直播音视频算法负责人,从事视频压缩,图像处理,语音增强方向的研究,参与完成的项目《编码摄像关键技术及应用》获得2019年国家科技进步二等奖。

演讲内容:在淘宝直播大规模实时系统中,如何通过底层算法及技术架构的升级,实现高画质,高音质,低延时直播,在确保用户体验的前提下,实现成本的大幅缩减。

5G时代的国际视频标准化最新动态

演讲时间:14:20-14:50

演讲嘉宾:叶琰,阿里巴巴(美国)达摩院研究员,负责前沿视频技术研发和高性能视频编解码硬件及软件实现。她的团队代表阿里巴巴在各个视频标准组织积极进行技术推进,包括国际视频标准(ITU-T/VCEG 与 ISO/IEC/MPEG),国家视频标准(AVS),以及业界视频标准联盟(AOM)等。她参与了多项视频编解码与流媒体的国际标准制定工作,包括 H.266/VVC,H.265/HEVC,SHVC,MV-HEVC,HEVC SCC,H.264/SVC,MPEG PCC,MPEG LCEVC,MPEG DASH,MPEG OMAF和MPEG CMAF 等,并曾就任多项国际标准的编辑。她是美国国家标准组织INCITS L3.1的主席, IEEE 的高级会员。她在中国科技大学获得本科及硕士学位,在美国加州大学获得博士学位。

演讲内容:随着5G时代的到来,超高清4K/8K视频,AR/VR/MR浸入式视频,以及机器视频等全新的视频消费形式将很快走入人们的日常生活中。为了能够高效低延时地传输处理这些海量的视频数据,必须要有最先进的视频编解码技术提供底座支撑。国际视频标准组织ISO/IEC MPEG和ITU-T近几年陆续出台多项相关的国际视频标准,其中包括最近刚刚出炉的下一代视频标准H.266/VVC,浸入式媒体标准系列MPEG-I,以及MPEG正在探索的机器视频编码。这个演讲将回顾VVC的发展历程以及VVC标准的压缩性能和它所能提供的各种灵活易用的功能,并一起展望AR/VR等浸入式视频内容在5G网上的未来。

内容AI升级:视频分析与生成

演讲时间:14:50-15:20

演讲嘉宾:潘攀(启磐),阿里巴巴达摩院资深算法专家,负责电商的视觉技术研发,服务于拍立淘,淘宝直播等应用场景。他博士毕业于美国伊利诺伊大学芝加哥分校,研究领域包括深度学习和计算机视觉等。他曾先后在美国三菱研究院和北京富士通研发中心从事视觉技术研发工作。

演讲内容:近年来围绕电商升级,电商内容从之前的图像/文字,走向了更富模态的直播和短视频。面临新的内容形式和新的业务形态,视觉技术也需要进行升级。比如通过升级图像的分析能力到视频,我们可以精确解析出视频出现的实体和关键属性。再比如通过结合三维和生成技术,我们创新得研发了虚拟主播这个新的产品形态。本次演讲会描述伴随内容升级的视频分析和生成技术,以及这些技术在阿里巴巴的各种应用。

深度学习在端侧AI的发展之路

演讲时间:15:20-15:50

演讲嘉宾:李晓波(篱悠),阿里巴巴淘系技术资深算法专家,2009年北大硕士毕业加入阿里巴巴,先后在B2B、阿里云、手淘等BU任职。目前在手淘负责多媒体算法部门,支持淘宝直播和短视频等业务。

演讲内容:随着技术的迭代更新,新的媒体形式不断推陈出新。短视频/直播、VR、AR、3D、MR等新兴的媒体技术不断出新,方新未艾。那么做为电商购物场景的手淘,在业务发展的过程中又是如何利用这些新兴技术来为用户带来更好的购物体验呢?

精彩内容将在10月23日(今天)13:30-16:00线上同步直播。

可扫描下方二维码,进行线上直播观看。
image.png

关注「淘系技术」微信公众号,一个有温度有内容的技术社区~

image.png

相关文章
|
12天前
|
消息中间件 人工智能 运维
12月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
953 64
|
4天前
|
人工智能 数据可视化 JavaScript
NodeTool:AI 工作流可视化构建器,通过拖放节点设计复杂的工作流,集成 OpenAI 等多个平台
NodeTool 是一个开源的 AI 工作流可视化构建器,通过拖放节点的方式设计复杂的工作流,无需编码即可快速原型设计和测试。它支持本地 GPU 运行 AI 模型,并与 Hugging Face、OpenAI 等平台集成,提供模型访问能力。
42 14
NodeTool:AI 工作流可视化构建器,通过拖放节点设计复杂的工作流,集成 OpenAI 等多个平台
|
8天前
|
机器学习/深度学习 传感器 运维
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
本文探讨了时间序列分析中数据缺失的问题,并通过实际案例展示了如何利用机器学习技术进行缺失值补充。文章构建了一个模拟的能源生产数据集,采用线性回归和决策树回归两种方法进行缺失值补充,并从统计特征、自相关性、趋势和季节性等多个维度进行了详细评估。结果显示,决策树方法在处理复杂非线性模式和保持数据局部特征方面表现更佳,而线性回归方法则适用于简单的线性趋势数据。文章最后总结了两种方法的优劣,并给出了实际应用建议。
34 7
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
|
18天前
|
人工智能 自然语言处理 前端开发
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
Lobe Vidol是一款开源的AI数字人交互平台,允许用户创建和互动自己的虚拟偶像。该平台提供流畅的对话体验、丰富的动作姿势库、优雅的用户界面设计以及多种技术支持,如文本到语音和语音到文本技术。Lobe Vidol适用于娱乐互动、在线教育、客户服务、品牌营销和社交媒体等多个应用场景。
76 7
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
|
2天前
|
人工智能 Serverless API
尽享红利,Serverless构建企业AI应用方案与实践
本次课程由阿里云云原生架构师计缘分享,主题为“尽享红利,Serverless构建企业AI应用方案与实践”。课程分为四个部分:1) Serverless技术价值,介绍其发展趋势及优势;2) Serverless函数计算与AI的结合,探讨两者融合的应用场景;3) Serverless函数计算AIGC应用方案,展示具体的技术实现和客户案例;4) 业务初期如何降低使用门槛,提供新用户权益和免费资源。通过这些内容,帮助企业和开发者快速构建高效、低成本的AI应用。
33 12
|
2天前
|
弹性计算 人工智能 数据管理
AI场景下的对象存储OSS数据管理实践
本文介绍了ECS和OSS的操作流程,分为两大部分。第一部分详细讲解了ECS的登录、密码重置、安全组设置及OSSUTIL工具的安装与配置,通过实验创建并管理存储桶,上传下载文件,确保资源及时释放。第二部分则聚焦于OSSFS工具的应用,演示如何将对象存储挂载为磁盘,进行大文件加载与模型训练,强调环境搭建(如Conda环境)及依赖安装步骤,确保实验结束后正确清理AccessKey和相关资源。整个过程注重操作细节与安全性,帮助用户高效利用云资源完成实验任务。
37 10
|
2天前
|
存储 人工智能 开发工具
AI场景下的对象存储OSS数据管理实践
本文介绍了对象存储(OSS)在AI业务中的应用与实践。内容涵盖四个方面:1) 对象存储作为AI数据基石,因其低成本和高弹性成为云上数据存储首选;2) AI场景下的对象存储实践方案,包括数据获取、预处理、训练及推理阶段的具体使用方法;3) 国内主要区域的默认吞吐量提升至100Gbps,优化了大数据量下的带宽需求;4) 常用工具介绍,如OSSutil、ossfs、Python SDK等,帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施,以及不同工具的特点和应用场景。
28 10
|
1天前
|
人工智能 自然语言处理 算法
主动式智能导购 AI 助手解决方案实践与测评
主动式智能导购 AI 助手解决方案实践与测评
|
10天前
|
编解码 机器人 测试技术
技术实践 | 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型快速搭建专业领域知识问答机器人
Qwen2-VL是一款具备高级图像和视频理解能力的多模态模型,支持多种语言,适用于多模态应用开发。通过PAI和LLaMA Factory框架,用户可以轻松微调Qwen2-VL模型,快速构建文旅领域的知识问答机器人。本教程详细介绍了从模型部署、微调到对话测试的全过程,帮助开发者高效实现定制化多模态应用。
|
9天前
|
机器学习/深度学习 人工智能 监控
AI视频监控技术的核心优势与实践
AI视频监控技术结合了计算机视觉、深度学习和大数据分析,能够实时分析监控画面,识别异常行为和场景变化。其核心在于从“被动记录”转型为“主动识别”,提升监控效率并减少安全隐患。主要应用场景包括泳池管理、健身器械区域、人员密度预警和异常事件检测。系统架构支持多种摄像头设备,采用边缘计算和Docker部署,具备实时性、高准确率和扩展性等优势。未来将优化复杂场景适应性和实时计算负载,进一步提高系统性能。
下一篇
DataWorks