本文来源:支付宝体验科技
日程与会场
大会日程分为两天。第一天是 Mobile 和 Cloud 的话题,而第二天在讨论 AI 与 Web。除了主旨演讲,开发者大会还开设有「工作坊」,让与会者有机会按照教程上手产品体验。我主要关注 Cloud、AI 和 Web 方面。
Cloud & AI
Google 想干嘛
先简单了解一下 Google 在 Cloud 和 AI 方面处于什么位置。
Google Cloud:
- Leader:在 Gartner 2023 云基础设施魔力象限中,与 AWS 和 MS 一样,被放在 Leaders 部分。
- 市场份额坐四望三:Gartner 2022 年云基础设施市场份额计算中,排名第四。与阿里云仅有 2 亿美元的差距,且有 40% 的年增长率。相比较,阿里云仅有 4% 的增长率。可以预见在 2023 年,阿里云会被夺去第三的宝座。
Google AI:
- 积累深厚:无论是早先的 Word2Vec 还是 Transformers,都是很重要的 AI 模型。在大语言模型领域 Google 也走得比较早。
当然后来被 OpenAI 抢在前面又是另一个故事了。
Timeline of release dates of LLMs with +10B parameters, Zhao W X, Zhou K, Li J, et al. A survey of large language models[J]. arXiv preprint arXiv:2303.18223, 2023.
背景输入完毕后,我们就可以通过这一页 PPT 知道 Google 这次是想干嘛:
基于 Google Cloud,全面使用生成式 AI,赋能企业与开发者。
使用这样的战略来向领先者 AW和和M 和 M 发起进攻。
基础模型
Vertex AI 提供了很多基础模型,比如用于分类、语义分析、总结的 text-bison,用于嵌入的 embedding,和用于代码生成的 code-bison。部分模型有 32k 版本,也就是能接受 32k 的 input token 和 8192 的 output token。
Vertex AI 平台
在底模之上,Google Cloud 提供了一个 Vertex AI 的机器学习平台。让用户可以在上面部署、训练、调试大模型。甚至还提供了一个 Model Garden 模型市场供用户发布大模型和使用别人发布的大模型。(这个玩到了。下面说)
Gen App Builder
提供了一个通过交互式对话生成 App 的工具(这货我去展示区找了一圈,没得玩):https://www.youtube.com/watch?v=cIacnd_Spnk
面向开发者的 Duet AI
Duet AI 做出来的部分跟 codeGPT 比较相似。基于 IDE 插件做的代码补全、生成和问答等能力。产品形态上都在理解范围内(毕竟开发者服务一开始大家都能想到做这些);画饼部分,辅助式无代码构建和辅助式运维还是很有想象力的。演讲者演示了一个用大模型辅助 K8S 运维的 Demo。很惊艳:
工作坊:Vertex AI Generative AI
Studio Google 开发者大会的「工作坊」环节非常给力。比如这个「生成式 AI 工作坊」,就准备了一批电脑,让参会者可以免费试用一下 Vertex AI。跟 OpenAI 的 Playground 基本上一毛一样。该有的都有。
比较特色的是提供了一个「结构化模式」。比较新奇。但是能解决大模型乱说话的问题。
比如我要让 AI 帮我做一个「句子情感识别」。我只需要做一个多样本提示的结构化输入:
输入1: A Well-made and entertaining film
输出1: positive
输入2: I fell aleep after 10 mins
输出2: negative
然后在下面的 Test 部分输入希望大模型分析的语句 “这个活动办得平平无奇”。大模型输出 “negative”。非常精准,并且不会乱说话。输出都会局限在 positive / negative / netural 范围内。
结构化模式:多样本提示
调试完之后导出代码。
实际上可以看到底层还是在 prompt,只不过帮你格式化了。
然后还试了一下代码生成。上面说模型的时候已经说过了。谷歌的代码生成有专门的底模。我这里不是在 Playground 里跑了。是直接在 Google Cloud 上启了一个 Google Colab notebook 跑的。如图所示我在让他给我生成一个俄罗斯方块。
不带 GPU 的云服务器上只要 5 秒。非常快。并且输出很干净,就是代码。
本场总结
Google Cloud X 生成式 AI 很明确就是在服务企业。提供一系列 AI 的基础设施,让企业可以进来定制、调试和部署生成式 AI。在此之上让企业构建基于生成式 AI 的应用与服务。并且也提供了一些数据安全性承诺。
如果我现在是一个希望在产品中引入大模型能力的创业者,谷歌提供的这一系列基础设施确实给我带来很大的吸引力。
Web
相比之下 Web 场就比较普通了。像什么新 DevTools,PassKeys,Privacy Sandbox 的都见过了。唯一这个话题比较有意思。
提升 Web 用户体验,助力出海业务成长
主要是看怎么论述 「Web 用户体验」与「业务成长」的因果性。
主要两个案例,一个是 Cocos,主要是如何跟 Chrome 合作,上了一些例如后渲染管线,WebGPU 一类的高级功能。另外还有提供便捷的让用户在游戏里嵌入广告这些优化。
另一个就比较有意思了。是阿里旗下的 Mirvaia,一个给西班牙消费者的电商平台。
与国内巨型 App 不同。欧洲还是习惯使用 Web。像这类电商 App,Web 流量居然还占 50%+
于是「Web 用户体验」与「业务成长」的因果关系得以论述:
- 外投类营销页面的转化率要求很高。提高性能可以直接促成营销页面转化率,从而带动业务增长
- 使用 SSR、View Transition API 等让 Web 得到一个接近于 Native App 的体验,可以缩短下单耗时。减少成交流失率。
- WebVitals 实时看板、基于 A/B Test 做评估后全量。
工作坊:Media Pipe
是一个端上可以跑的机器学习库,有机器视觉、文本、音频等常用算法。这个其实已经公开并且开源了。可以玩。https://mediapipe-studio.webapps.google.com/studio/demo/object_detector
总结
可能是对 Google 期望太高,Google I/O Connect Shanghai 并没有给我太超出期望的部分。Cloud & AI 很棒。大模型的输出特别稳定,LLM for developers 大家都知道往这个方向做,能做到 Google 这个程度确实不容易。但也仅此而已。没有到「惊为天人」的程度。
对开发者来说,这一套东西确实给得比较舒服。再配合向量数据库,对我们这种想在应用层玩一点东西的同学很友好(甚至比蚂蚁内部还友好。
也给到我一些输入。例如 Duet AI 辅助式开发运维和数据探索的这部分。