本地生活技术雷达——生成式AI(Generative AI)在阿里本地生活的应用与思考

本文涉及的产品
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 本地生活技术雷达是由本地生活技术中心战略管理&PMO团队开展的,定期扫描和评估新兴技术的战略研究工作。目的是对技术趋势进行前瞻性预判,提出新技术布局建议,在技术驱动业务创新和业务增长、践行社会责任等方面有一些实质性探索。本篇尝试探讨1)理解AI范式——从分析型(Analytical AI)到生成式(Generative AI)的拐点在2022年,其对人类社会以及商业模式的长期影响;2)生成式AI(文生文、文生图、图生图等)在本地业务目前场景的应用和未来的方向。欢迎技术、产品、运营、战略、管理层、国内国际等各种视角的指点和碰撞!

一、AIGC的重要发展拐点和历史进程



1.从Analytical AI到Generative AI的转移

     此前的分析型AIAnalytical AI)是根据已有数据进行分析、判断、预测,典型应用为内容的智能推荐(短视频)、自动驾驶等;生成式AIGenerative AI)更强调学习归纳后进行演绎创造,生成全新的内容。



2.算法迭代的理解

     在预训练大模型的基础上,AI生成能力的落地体现2022年主要在两个维度:1Text-to-Image生成模型的代际性迁移所带来的高质量、快速、多样性三者兼得的大规模应用落地;2)开放域生成式对话工具(Text-to-TextTransformer-basedChat-GPT的提出。

从第一个Text-to-Image生成模型的演变来看

image.png

从第二个Text-to-Text Transformer-basedChatGPT的提出来看

image.png

3.实际行业应用

对行业格局的理解:尽管AIGC需要巨量算力、资金和研发人才、调参人员,Generative AI本质是一个"巨头的生意",目前成立的大量创业公司会被收购或者消失,但行业的生态位和社会化分工依然给中小玩家和垂直领域提供了机会。

image.png



尽管不同领域的成熟度不一样,从应用历史进程预测来看,Gartner预测从文字生成文字的能力到2025年水平高于人类平均水平。

image.png

具体代表性公司如下:这里面的成熟度每天日新月异,公司的代表性产品也在不断迭代和拓展,欢迎大佬们随时Update

image.png

具体来举两个市场上的创业公司生动的例子,玩起来~

(别着急,本地生成能力例子也有,在后面,请一直看下去O(_)O~!)

一个生成文案

image.png



一个生成图片

image.png



最近Microsoft Bing的发布会上结合ChatGPT后新的搜索引擎的对复杂问题的解决/生成能力

image.png

4.生成式AI对行业和工作方式影响的预判

中短期,text-texttext-imagetext-videoimage-imageimage-video等技术还在不断成熟,主要对内容相关行业有较大影响,对电商等运营驱动行业,在营销、商品、客服等环节有局部影响

中长期,在text-x单维度能力成熟后,将演变为以业务\运营目标为导向的多维度组合生成能力,改变软件交互方式,在线上化-实时化-智能化发展过程中,智能化阶段从目前的分析\决策智能化演进为分析\决策智能化+生成智能化(多维度内容组成的场景),对以运营为主的互联网公司会产生综合影响。以营销活动会场搭建为例,将基于营销活动目标、活动主题等,智能化生成包含textimagevideo等内容形态的营销会场等。

(这里有共鸣的小伙伴欢迎来举例!)

image.png



在落地先后的判断上,预计设计师比程序员更早受到实际影响,一是模型技术成熟度,二是两者对生成内容的容错率不同,三是设计和创作行业已验证所需成本因AIGC大幅降低。可参考A16Z

各位技术大神、设计大神可能都有一些使用这类AIGC工具的反馈,欢迎大家来聊自己的体验和判断!你的反馈可能是下一个深入研究的入口~



5. 行业性挑战问题

image.png



二、阿里集团在生成式AI的相关能力布局

image.png



三、生成式AI在本地生活的应用场景及技术布局建议



中短期2年内投入资源优先级思考

这里Highlight1AIGC在商品信息质量管理中降本提效的作用,以及2)作为整体AI发展的重要基建:垂直领域的多模态知识图谱。image.png





具体看Text-to-text场景

image.png



具体看Text-to-image场景

image.png





具体看Image-to-Image场景

image.png



具体看Text-to-text生成对话能力

image.png



具体看多模态知识图谱

image.png





四、参考学习

在这里冒昧放一张淘宝META技术在AIGC方向的探索,作为我们学习和参照的落地方~

image.png



五、思考和未来探索

image.png

Last but not the least

 

 





 

相关文章
|
2天前
|
机器学习/深度学习 人工智能 搜索推荐
AI技术在现代医疗领域的革命性应用
随着人工智能技术的飞速发展,其在医疗领域的应用也日益广泛。本文将从AI技术在医疗诊断、治疗和健康管理等方面的应用入手,探讨其如何改变传统医疗模式,提高医疗服务质量和效率。同时,我们也将关注AI技术在医疗领域面临的挑战和未来发展趋势。
|
1天前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
3天前
|
机器学习/深度学习 存储 人工智能
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
【9月更文挑战第1天】AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
|
1天前
|
机器学习/深度学习 人工智能 自动驾驶
AI与未来:探索智能技术的新纪元
【9月更文挑战第9天】本文将探讨人工智能(AI)的发展历程、现状和未来趋势。我们将从AI的基本概念入手,逐步深入到其在各个领域的应用,以及它对社会的影响。最后,我们将展望AI的未来,探讨其可能带来的变革。
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在文本情感分析中的应用
【8月更文挑战第40天】本文将深入探讨人工智能在文本情感分析领域的强大应用。我们将从基础概念出发,逐步深入到技术实现,最终通过一个Python代码示例具体展示如何使用自然语言处理库进行情感分析。文章旨在为读者提供一个清晰的指南,了解并实践如何利用AI技术解读和评估文本中的情感色彩。
|
4天前
|
人工智能 监控 安全
揭秘AI技术在智能家居中的应用
【9月更文挑战第6天】本文深入探讨了AI技术如何在智能家居领域大放异彩。从智能语音助手到自动化家居控制,再到安全监控和能源管理,AI技术正在改变我们的生活方式。文章还将通过代码示例,展示如何利用AI技术实现家居自动化控制。
28 5
|
4天前
|
机器学习/深度学习 人工智能 搜索推荐
如何让你的Uno Platform应用秒变AI大神?从零开始,轻松集成机器学习功能,让应用智能起来,用户惊呼太神奇!
【9月更文挑战第8天】随着技术的发展,人工智能与机器学习已融入日常生活,特别是在移动应用开发中。Uno Platform 是一个强大的框架,支持使用 C# 和 XAML 开发跨平台应用(涵盖 Windows、macOS、iOS、Android 和 Web)。本文探讨如何在 Uno Platform 中集成机器学习功能,通过示例代码展示从模型选择、训练到应用集成的全过程,并介绍如何利用 Onnx Runtime 等库实现在 Uno 平台上的模型运行,最终提升应用智能化水平和用户体验。
13 1
|
1天前
|
存储 机器学习/深度学习 人工智能
深入浅出 AI 智能体(AI Agent)|技术干货
随着人工智能技术的发展,智能体(AI Agents)逐渐成为人与大模型交互的主要方式。智能体能执行任务、解决问题,并提供个性化服务。其关键组成部分包括规划、记忆和工具使用,使交互更加高效、自然。智能体的应用涵盖专业领域问答、资讯整理、角色扮演等场景,极大地提升了用户体验与工作效率。借助智能体开发平台,用户可以轻松打造定制化AI应用,推动AI技术在各领域的广泛应用与深度融合。
40 0
|
10天前
|
人工智能 运维 自然语言处理
AI战略丨构建未来: 生成式人工智能技术落地策略
GenAI 的技术落地需要企业进行周密地规划和持续地努力。企业必须从自身的战略出发, 综合考虑成本、效果和性能,制定合理的技术架构,通过全面的 AI 治理,实现可持续的创新和发展。
|
9天前
|
数据采集 人工智能 算法
AI技术在医疗领域的应用与挑战
【9月更文挑战第2天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将通过分析AI技术在诊断、治疗和预防等方面的实际应用案例,揭示其潜力和局限性。同时,我们还将讨论数据隐私、伦理道德和技术准确性等关键问题,以期为未来的研究和实践提供启示。
31 6