2023 Google I/O Connect Shanghai 参会总结:云,AI 与 Web

简介: 2023 Google I/O Connect Shanghai 参会总结:云,AI 与 Web

本文来源:支付宝体验科技

image.png

  日程与会场


大会日程分为两天。第一天是 Mobile 和 Cloud 的话题,而第二天在讨论 AI 与 Web。除了主旨演讲,开发者大会还开设有「工作坊」,让与会者有机会按照教程上手产品体验。我主要关注 Cloud、AI 和 Web 方面。



  Cloud & AI


Google 想干嘛


先简单了解一下 Google 在 Cloud 和 AI 方面处于什么位置。

Google Cloud:

  • Leader:在 Gartner 2023 云基础设施魔力象限中,与 AWS 和 MS 一样,被放在 Leaders 部分。
  • 市场份额坐四望三:Gartner 2022 年云基础设施市场份额计算中,排名第四。与阿里云仅有 2 亿美元的差距,且有 40% 的年增长率。相比较,阿里云仅有 4% 的增长率。可以预见在 2023 年,阿里云会被夺去第三的宝座。

Google AI:

  • 积累深厚:无论是早先的 Word2Vec 还是 Transformers,都是很重要的 AI 模型。在大语言模型领域 Google 也走得比较早。当然后来被 OpenAI 抢在前面又是另一个故事了。



https://www.gartner.com/en/newsroom/press-releases/2023-07-18-gartner-says-worldwide-iaas-public-cloud-services-revenue-grew-30-percent-in-2022-exceeding-100-billion-for-the-first-time

Timeline of release dates of LLMs with +10B parameters, Zhao W X, Zhou K, Li J, et al. A survey of large language models[J]. arXiv preprint arXiv:2303.18223, 2023.

背景输入完毕后,我们就可以通过这一页 PPT 知道 Google 这次是想干嘛:

基于 Google Cloud,全面使用生成式 AI,赋能企业与开发者。

使用这样的战略来向领先者 AW和M 和 M 发起进攻。


基础模型


Vertex AI 提供了很多基础模型,比如用于分类、语义分析、总结的 text-bison,用于嵌入的 embedding,和用于代码生成的 code-bison。部分模型有 32k 版本,也就是能接受 32k 的 input token 和 8192 的 output token。



Vertex AI 平台


在底模之上,Google Cloud 提供了一个 Vertex AI 的机器学习平台。让用户可以在上面部署、训练、调试大模型。甚至还提供了一个 Model Garden 模型市场供用户发布大模型和使用别人发布的大模型。(这个玩到了。下面说)

image.png

image.png

Gen App Builder


提供了一个通过交互式对话生成 App 的工具(这货我去展示区找了一圈,没得玩):https://www.youtube.com/watch?v=cIacnd_Spnk


面向开发者的 Duet AI

image.png

image.png

image.png

Duet AI 做出来的部分跟 codeGPT 比较相似。基于 IDE 插件做的代码补全、生成和问答等能力。产品形态上都在理解范围内(毕竟开发者服务一开始大家都能想到做这些);画饼部分,辅助式无代码构建和辅助式运维还是很有想象力的。演讲者演示了一个用大模型辅助 K8S 运维的 Demo。很惊艳:


工作坊:Vertex AI Generative AI

Studio Google 开发者大会的「工作坊」环节非常给力。比如这个「生成式 AI 工作坊」,就准备了一批电脑,让参会者可以免费试用一下 Vertex AI。跟 OpenAI 的 Playground 基本上一毛一样。该有的都有。

image.png


比较特色的是提供了一个「结构化模式」。比较新奇。但是能解决大模型乱说话的问题。

比如我要让 AI 帮我做一个「句子情感识别」。我只需要做一个多样本提示的结构化输入:

输入1: A Well-made and entertaining film

输出1: positive

输入2: I fell aleep after 10 mins

输出2: negative

然后在下面的 Test 部分输入希望大模型分析的语句 “这个活动办得平平无奇”。大模型输出 “negative”。非常精准,并且不会乱说话。输出都会局限在 positive / negative / netural 范围内。

image.png

结构化模式:多样本提示

调试完之后导出代码。

实际上可以看到底层还是在 prompt,只不过帮你格式化了。

image.png

然后还试了一下代码生成。上面说模型的时候已经说过了。谷歌的代码生成有专门的底模。我这里不是在 Playground 里跑了。是直接在 Google Cloud 上启了一个 Google Colab notebook 跑的。如图所示我在让他给我生成一个俄罗斯方块。

不带 GPU 的云服务器上只要 5 秒。非常快。并且输出很干净,就是代码。

本场总结


Google Cloud X 生成式 AI 很明确就是在服务企业。提供一系列 AI 的基础设施,让企业可以进来定制、调试和部署生成式 AI。在此之上让企业构建基于生成式 AI 的应用与服务。并且也提供了一些数据安全性承诺。

如果我现在是一个希望在产品中引入大模型能力的创业者,谷歌提供的这一系列基础设施确实给我带来很大的吸引力。

image.png

image.png


  Web



相比之下 Web 场就比较普通了。像什么新 DevTools,PassKeys,Privacy Sandbox 的都见过了。唯一这个话题比较有意思。


提升 Web 用户体验,助力出海业务成长

image.png

主要是看怎么论述 「Web 用户体验」与「业务成长」的因果性。

主要两个案例,一个是 Cocos,主要是如何跟 Chrome 合作,上了一些例如后渲染管线,WebGPU 一类的高级功能。另外还有提供便捷的让用户在游戏里嵌入广告这些优化。

另一个就比较有意思了。是阿里旗下的 Mirvaia,一个给西班牙消费者的电商平台。

与国内巨型 App 不同。欧洲还是习惯使用 Web。像这类电商 App,Web 流量居然还占 50%+

于是「Web 用户体验」与「业务成长」的因果关系得以论述:

  • 外投类营销页面的转化率要求很高。提高性能可以直接促成营销页面转化率,从而带动业务增长
  • 使用 SSR、View Transition API 等让 Web 得到一个接近于 Native App 的体验,可以缩短下单耗时。减少成交流失率。
  • WebVitals 实时看板、基于 A/B Test 做评估后全量。

image.png


工作坊:Media Pipe

是一个端上可以跑的机器学习库,有机器视觉、文本、音频等常用算法。这个其实已经公开并且开源了。可以玩。https://mediapipe-studio.webapps.google.com/studio/demo/object_detector

image.png

image.png


  总结


可能是对 Google 期望太高,Google I/O Connect Shanghai 并没有给我太超出期望的部分。Cloud & AI 很棒。大模型的输出特别稳定,LLM for developers 大家都知道往这个方向做,能做到 Google 这个程度确实不容易。但也仅此而已。没有到「惊为天人」的程度。

对开发者来说,这一套东西确实给得比较舒服。再配合向量数据库,对我们这种想在应用层玩一点东西的同学很友好(甚至比蚂蚁内部还友好。

也给到我一些输入。例如 Duet AI 辅助式开发运维和数据探索的这部分。


相关文章
|
4月前
|
人工智能 编解码 安全
[AI Google] 基于我们对提供负责任的人工智能的承诺
今天,我们宣布了新的人工智能保障措施,以防止滥用,并推出了利用人工智能使学习更具吸引力和可访问性的新工具
[AI Google] 基于我们对提供负责任的人工智能的承诺
|
28天前
|
人工智能 自然语言处理 安全
Google Gemini 1.5 Pro在AI竞赛中遥遥领先,挑战GPT-4o
Google Gemini 1.5 Pro在AI竞赛中遥遥领先,挑战GPT-4o
Google Gemini 1.5 Pro在AI竞赛中遥遥领先,挑战GPT-4o
|
28天前
|
人工智能 自然语言处理 搜索推荐
【人工智能】人工智能(AI)、Web 3.0和元宇宙三者联系、应用及未来发展趋势的详细分析
人工智能(AI)、Web 3.0和元宇宙作为当前科技领域的热门话题,它们之间存在着紧密的联系,并在各自领域内展现出广泛的应用和未来的发展趋势。以下是对这三者联系、应用及未来发展趋势的详细分析
42 2
【人工智能】人工智能(AI)、Web 3.0和元宇宙三者联系、应用及未来发展趋势的详细分析
|
14天前
|
人工智能 开发者 前端开发
【创新·未来】当AI遇见代码:Vaadin Copilot引领Web开发新时代,你准备好了吗?
【8月更文挑战第31天】Vaadin 是一个成熟的 Java Web 应用框架,最新版本 24.4.0 带来了多项更新,包括引入 Vaadin Copilot——一个集成 AI 的开发工具,可实现拖放组件、实时更新源代码等功能。此外,Vaadin 24.4.0 还统一了 Hilla 框架,支持 Flow 和 Hilla 视图混合应用,实现 React 组件与 Java 应用的无缝集成。未来,Vaadin 将继续提升开发者体验和应用性能,整合更多现代 Web 技术,如 Web 组件和 PWA 支持,保持其在企业级应用开发领域的领先地位。
30 0
|
1月前
|
人工智能 JSON 自然语言处理
我的Google Vertex AI实践经验分享
忙碌的开发者分享了使用Google Vertex AI的实践经验。从复杂的初始设置到微调模型时的手动资源分配,作者经历了种种挑战,包括高昂的成本与不足的文档支持。尽管如此,Vertex AI在图像识别和自然语言处理方面展现出强大能力。作者希望反馈能帮助Google改进服务,使之更加用户友好。
40 2
|
21天前
|
机器学习/深度学习 人工智能 前端开发
AI计算机视觉笔记三:WEB端部署YOLOv5
本文档介绍了如何将YOLOv5目标检测模型部署到Web端的方法,包括基于Flask和Streamlit两种实现方案。首先创建Python虚拟环境并安装必要的依赖库。接着详细展示了Flask方案下的前端HTML页面与后端Python逻辑代码,该方案利用Flask框架搭建服务器,处理实时视频流,并显示检测结果。随后介绍了Streamlit方案,该方案更简洁直观,适合快速开发交互式的机器学习应用。通过`streamlit run`命令即可启动应用,支持图像、视频及实时摄像头的目标检测演示。两种部署方式各有优势,Flask灵活性高,适用于复杂项目;而Streamlit则易于上手,便于快速原型设计。
|
1月前
|
Web App开发 人工智能 iOS开发
灵办AI助手Chrome插件全面评测:PC Web端的智能办公利器
《灵办AI助手:Mac OS下的高效办公利器》 灵办AI助手是一款专为提升工作效率而设计的浏览器插件,适用于Chrome、Edge等主流浏览器,在Mac OS系统中表现尤其出众。本文将深入评测其核心功能,包括网页翻译、AI对话、AI阅读及代码辅助等,展示如何在实际工作中运用这些功能来提升效率。此外,文中还提供了详细的安装与设置指南,帮助读者轻松上手这款办公神器。无论你是学生、职场人还是开发者,灵办AI助手都能成为你提高生产力的理想选择。
75 0
|
2月前
|
人工智能 自然语言处理 数据挖掘
详解:Google AI Gemini中文版本(基于API 开发实现对话)
谷歌旗下的人工智能应用Gemini,自问世以来凭借其强大的计算能力和高效的处理性能,迅速成为全球用户的宠儿。作为一款由世界顶尖科技公司开发的产品,Gemini不仅在语言处理、图像识别、数据分析等领域表现出色,还在多种复杂任务中展现了其卓越的智能决策能力。然而,由于网络限制等问题,国内用户往往无法直接访问和使用Gemini的网站,这也导致了许多技术爱好者和专业人士未能亲身体验这一先进技术所带来的便利和强大功能。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
Google gemini官网入口是什么_谷歌 AI gemini国内怎么使用
随着人工智能(AI)技术的迅猛发展,各大科技公司不断推出更为先进的AI模型,推动技术的边界。Google开发的Gemini便是其中的佼佼者。作为一款大型语言模型(LLM),Gemini旨在处理多种自然语言处理(NLP)任务,如文本生成、翻译、摘要和对话生成。Gemini结合了最新的研究成果和技术,显著提高了自然语言处理的准确性和效率。
|
3月前
|
人工智能
[AI Google] 三种新方法利用 Gemini 提高 Google Workspace 的生产力
Workspace 侧边栏中的 Gemini 现在将使用 Gemini 1.5 Pro,新的 Gemini for Workspace 功能即将登陆 Gmail 移动应用,等等。
[AI Google] 三种新方法利用 Gemini 提高 Google Workspace 的生产力

热门文章

最新文章