本地生活技术雷达——生成式AI(Generative AI)在阿里本地生活的应用与思考

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
简介: 本地生活技术雷达是由本地生活技术中心战略管理&PMO团队开展的,定期扫描和评估新兴技术的战略研究工作。目的是对技术趋势进行前瞻性预判,提出新技术布局建议,在技术驱动业务创新和业务增长、践行社会责任等方面有一些实质性探索。本篇尝试探讨1)理解AI范式——从分析型(Analytical AI)到生成式(Generative AI)的拐点在2022年,其对人类社会以及商业模式的长期影响;2)生成式AI(文生文、文生图、图生图等)在本地业务目前场景的应用和未来的方向。欢迎技术、产品、运营、战略、管理层、国内国际等各种视角的指点和碰撞!

一、AIGC的重要发展拐点和历史进程



1.从Analytical AI到Generative AI的转移

     此前的分析型AIAnalytical AI)是根据已有数据进行分析、判断、预测,典型应用为内容的智能推荐(短视频)、自动驾驶等;生成式AIGenerative AI)更强调学习归纳后进行演绎创造,生成全新的内容。



2.算法迭代的理解

     在预训练大模型的基础上,AI生成能力的落地体现2022年主要在两个维度:1Text-to-Image生成模型的代际性迁移所带来的高质量、快速、多样性三者兼得的大规模应用落地;2)开放域生成式对话工具(Text-to-TextTransformer-basedChat-GPT的提出。

从第一个Text-to-Image生成模型的演变来看

image.png

从第二个Text-to-Text Transformer-basedChatGPT的提出来看

image.png

3.实际行业应用

对行业格局的理解:尽管AIGC需要巨量算力、资金和研发人才、调参人员,Generative AI本质是一个"巨头的生意",目前成立的大量创业公司会被收购或者消失,但行业的生态位和社会化分工依然给中小玩家和垂直领域提供了机会。

image.png



尽管不同领域的成熟度不一样,从应用历史进程预测来看,Gartner预测从文字生成文字的能力到2025年水平高于人类平均水平。

image.png

具体代表性公司如下:这里面的成熟度每天日新月异,公司的代表性产品也在不断迭代和拓展,欢迎大佬们随时Update

image.png

具体来举两个市场上的创业公司生动的例子,玩起来~

(别着急,本地生成能力例子也有,在后面,请一直看下去O(_)O~!)

一个生成文案

image.png



一个生成图片

image.png



最近Microsoft Bing的发布会上结合ChatGPT后新的搜索引擎的对复杂问题的解决/生成能力

image.png

4.生成式AI对行业和工作方式影响的预判

中短期,text-texttext-imagetext-videoimage-imageimage-video等技术还在不断成熟,主要对内容相关行业有较大影响,对电商等运营驱动行业,在营销、商品、客服等环节有局部影响

中长期,在text-x单维度能力成熟后,将演变为以业务\运营目标为导向的多维度组合生成能力,改变软件交互方式,在线上化-实时化-智能化发展过程中,智能化阶段从目前的分析\决策智能化演进为分析\决策智能化+生成智能化(多维度内容组成的场景),对以运营为主的互联网公司会产生综合影响。以营销活动会场搭建为例,将基于营销活动目标、活动主题等,智能化生成包含textimagevideo等内容形态的营销会场等。

(这里有共鸣的小伙伴欢迎来举例!)

image.png



在落地先后的判断上,预计设计师比程序员更早受到实际影响,一是模型技术成熟度,二是两者对生成内容的容错率不同,三是设计和创作行业已验证所需成本因AIGC大幅降低。可参考A16Z

各位技术大神、设计大神可能都有一些使用这类AIGC工具的反馈,欢迎大家来聊自己的体验和判断!你的反馈可能是下一个深入研究的入口~



5. 行业性挑战问题

image.png



二、阿里集团在生成式AI的相关能力布局

image.png



三、生成式AI在本地生活的应用场景及技术布局建议



中短期2年内投入资源优先级思考

这里Highlight1AIGC在商品信息质量管理中降本提效的作用,以及2)作为整体AI发展的重要基建:垂直领域的多模态知识图谱。image.png





具体看Text-to-text场景

image.png



具体看Text-to-image场景

image.png





具体看Image-to-Image场景

image.png



具体看Text-to-text生成对话能力

image.png



具体看多模态知识图谱

image.png





四、参考学习

在这里冒昧放一张淘宝META技术在AIGC方向的探索,作为我们学习和参照的落地方~

image.png



五、思考和未来探索

image.png

Last but not the least

 

 





 

相关文章
|
4天前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
51 31
|
6天前
|
机器学习/深度学习 人工智能 监控
AI在交通管理系统中的应用
AI在交通管理系统中的应用
43 23
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
AI写作新时代:自然语言生成技术与写作助手的结合
AI写作新时代:自然语言生成技术与写作助手的结合
44 16
|
4天前
|
人工智能 算法 搜索推荐
阿里云百炼xWaytoAGI共学课开课:手把手学AI,大咖带你从零搭建AI应用
阿里云百炼xWaytoAGI共学课开课啦。大咖带你从零搭建AI应用,玩转阿里云百炼大模型平台。3天课程,涵盖企业级文本知识库案例、多模态交互应用实操等,适合有开发经验的企业或独立开发者。直播时间:2025年1月7日-9日 20:00,地点:阿里云/WaytoAGI微信视频号。参与课程可赢取定制保温杯、雨伞及磁吸充电宝等奖品。欢迎加入钉钉共学群(群号:101765012406),与百万开发者共学、共享、共实践!
|
1天前
|
人工智能 API 开发者
阿里CEO吴泳铭-2024互联网大会发言:AI的最大价值是推动生产力变革
11月21日,2024年世界互联网大会“互联网企业家论坛”在乌镇召开。阿里巴巴CEO吴泳铭表示,AI的最大价值在于推动各行各业的生产力变革,而非仅限于开发超级APP。他强调,发展AI需建设繁荣的技术、产品和市场生态。目前,30多万家企业已接入阿里“通义”大模型,应用于代码开发、药物研发等场景。阿里巴巴坚持开源路线,全球开发者基于“通义千问”开发的衍生模型已突破7.8万个。吴泳铭认为,AI的发展需要行业共同努力,建设繁荣生态以实现高质量持续发展。
|
3天前
|
存储 人工智能 监控
AI视频监控技术在公租房管理中的应用:提升监管精准度与效率
该AI视频监控系统具备1080P高清与夜视能力,采用深度学习技术实现高精度人脸识别(误识率1%),并支持实时预警功能,响应时间小于5秒。系统支持私有化部署,保障数据隐私安全,适用于大规模公租房社区管理,可容纳10万以上人脸库。基于开源架构和Docker镜像,一键部署简单快捷,确保24小时稳定运行,并提供详细的后台数据分析报表,助力政府决策。
|
4天前
|
存储 人工智能 Serverless
7分钟玩转 AI 应用,函数计算一键部署 AI 生图大模型
人工智能生成图像(AI 生图)的领域中,Stable Diffusion WebUI 以其强大的算法和稳定的输出质量而闻名。它能够快速地从文本描述中生成高质量的图像,为用户提供了一个直观且高效的创作平台。而 ComfyUI 则以其用户友好的界面和高度定制化的选项所受到欢迎。ComfyUI 的灵活性和直观性使得即使是没有技术背景的用户也能轻松上手。本次技术解决方案通过函数计算一键部署热门 AI 生图大模型,凭借其按量付费、卓越弹性、快速交付能力的特点,完美实现低成本,免运维。
|
7天前
|
数据采集 人工智能 运维
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案。
|
8天前
|
人工智能 供应链 安全
面向高效大模型推理的软硬协同加速技术 多元化 AI 硬件引入评测体系
本文介绍了AI硬件评测体系的三大核心方面:统一评测标准、平台化与工具化、多维度数据消费链路。通过标准化评测流程,涵盖硬件性能、模型推理和训练性能,确保评测结果客观透明。平台化实现资源管理与任务调度,支持大规模周期性评测;工具化则应对紧急场景,快速适配并生成报告。最后,多维度数据消费链路将评测数据结构化保存,服务于综合通用、特定业务及专业性能分析等场景,帮助用户更好地理解和使用AI硬件。
|
8天前
|
人工智能 运维 API
PAI企业级能力升级:应用系统构建、高效资源管理、AI治理
PAI平台针对企业用户在AI应用中的复杂需求,提供了全面的企业级能力。涵盖权限管理、资源分配、任务调度与资产管理等模块,确保高效利用AI资源。通过API和SDK支持定制化开发,满足不同企业的特殊需求。典型案例中,某顶尖高校基于PAI构建了融合AI与HPC的科研计算平台,实现了作业、运营及运维三大中心的高效管理,成功服务于校内外多个场景。

热门文章

最新文章