一、AIGC的重要发展拐点和历史进程
1.从Analytical AI到Generative AI的转移
此前的分析型AI(Analytical AI)是根据已有数据进行分析、判断、预测,典型应用为内容的智能推荐(短视频)、自动驾驶等;生成式AI(Generative AI)更强调学习归纳后进行演绎创造,生成全新的内容。
2.算法迭代的理解
在预训练大模型的基础上,AI生成能力的落地体现2022年主要在两个维度:1)Text-to-Image生成模型的代际性迁移所带来的高质量、快速、多样性三者兼得的大规模应用落地;2)开放域生成式对话工具(Text-to-Text)Transformer-based的Chat-GPT的提出。
从第一个Text-to-Image生成模型的演变来看
从第二个Text-to-Text Transformer-based的ChatGPT的提出来看
3.实际行业应用
对行业格局的理解:尽管AIGC需要巨量算力、资金和研发人才、调参人员,Generative AI本质是一个"巨头的生意",目前成立的大量创业公司会被收购或者消失,但行业的生态位和社会化分工依然给中小玩家和垂直领域提供了机会。
尽管不同领域的成熟度不一样,从应用历史进程预测来看,Gartner预测从文字生成文字的能力到2025年水平高于人类平均水平。
具体代表性公司如下:这里面的成熟度每天日新月异,公司的代表性产品也在不断迭代和拓展,欢迎大佬们随时Update!
具体来举两个市场上的创业公司生动的例子,玩起来~
(别着急,本地生成能力例子也有,在后面,请一直看下去O(∩_∩)O~!)
一个生成文案
一个生成图片
最近Microsoft Bing的发布会上结合ChatGPT后新的搜索引擎的对复杂问题的解决/生成能力
4.生成式AI对行业和工作方式影响的预判
●中短期,text-text、text-image、text-video、image-image、image-video等技术还在不断成熟,主要对内容相关行业有较大影响,对电商等运营驱动行业,在营销、商品、客服等环节有局部影响。
●中长期,在text-x单维度能力成熟后,将演变为以业务\运营目标为导向的多维度组合生成能力,改变软件交互方式,在线上化-实时化-智能化发展过程中,智能化阶段从目前的分析\决策智能化演进为分析\决策智能化+生成智能化(多维度内容组成的场景),对以运营为主的互联网公司会产生综合影响。以营销活动会场搭建为例,将基于营销活动目标、活动主题等,智能化生成包含text、image、video等内容形态的营销会场等。
(这里有共鸣的小伙伴欢迎来举例!)
在落地先后的判断上,预计设计师比程序员更早受到实际影响,一是模型技术成熟度,二是两者对生成内容的容错率不同,三是设计和创作行业已验证所需成本因AIGC大幅降低。可参考A16Z。
各位技术大神、设计大神可能都有一些使用这类AIGC工具的反馈,欢迎大家来聊自己的体验和判断!你的反馈可能是下一个深入研究的入口~
5. 行业性挑战问题
二、阿里集团在生成式AI的相关能力布局
三、生成式AI在本地生活的应用场景及技术布局建议
中短期2年内投入资源优先级思考
这里Highlight了1)AIGC在商品信息质量管理中降本提效的作用,以及2)作为整体AI发展的重要基建:垂直领域的多模态知识图谱。
具体看Text-to-text场景
具体看Text-to-image场景
具体看Image-to-Image场景
具体看Text-to-text生成对话能力
具体看多模态知识图谱
四、参考学习
在这里冒昧放一张淘宝META技术在AIGC方向的探索,作为我们学习和参照的落地方~
五、思考和未来探索
Last but not the least