Google提出的网页性能评价指标

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: Google推出的“网页指标”计划旨在优化网页用户体验,其中Core Web Vitals为核心指标,包括Largest Contentful Paint (LCP)、Interaction to Next Paint (INP)和Cumulative Layout Shift (CLS),分别衡量加载速度、互动性和视觉稳定性。这些指标采用第75百分位数评估,确保在不同设备和网络环境下提供一致的用户体验。

Google提出的网页性能评价指标

“网页指标”是 Google 推出的一项计划,旨在针对对于提供出色的网页用户体验至关重要的质量信号提供统一指导。Google提出了Web Vitals计划旨在简化环境,帮助网站专注于最重要的指标,即 Core Web Vitals。

核心网页指标(Core Web Vitals)

Core Web Vitals选中的三个指标是LCP、INP和CLS:

  • Largest Contentful Paint (LCP):加载速度,用于衡量感知的加载速度,并在网页加载时间轴上标记页面主要内容可能已加载的时间点。衡量从网页开始加载到屏幕上呈现最大的文本块或图片元素所用的时间,为了提供良好的用户体验,应在网页首次开始加载的 2.5 秒内完成 LCP。
  • Interaction to Next Paint (INP):互动性,用于衡量响应能力并量化用户尝试与页面互动时的感受。衡量与网页进行的每个点按、点击或键盘互动的延迟时间,并根据互动次数选择网页最差(或接近最长的互动延迟时间)作为单个代表性值,以描述网页的整体响应能力。为了提供良好的用户体验,网页的 INP 应不超过 200 毫秒。
  • Cumulative Layout Shift (CLS):视觉稳定性,用于衡量视觉稳定性,并量化可见网页内容的意外布局偏移。衡量从网页开始加载到其生命周期状态变为隐藏期间发生的所有意外布局偏移的累计得分。为了提供良好的用户体验,网页的 CLS 应保持为 0.1或更低。


那么一个页面的加载就算是每次都是一样的测试环境也会出现每次测试的结果都不一样,更别提再加上真实用户千差万别的访问设备、网络环境、地理位置等因素的影响了。因此Google的Core Web Vitals给出了一个合适的评价方法,就是采用对应指标的第三四分位数(也就是第75个百分位数)作为考察点,如果一个网页全部Core Web Vitals的三个指标的第三四分位数都达到了如上图中的Good部分,那么评估结果就是Good,否则就需要改进。
不过,如果某个网站在某种程度上与众不同,就需要使用额外的指标才能全面掌握网站的情况。例如,LCP 指标旨在衡量网页的主要内容何时完成加载,但在某些情况下,最大的元素并不属于网页主要内容,因此 LCP 可能与网页不相关。

Google提出者Core Web Vital的指标会随着时间的推移而变化,不会永远一成不变。

加载速度LCP

LCP 会报告视口中可见的最大图片、文本块或视频的渲染时间(相对于用户首次导航到网页的时间)。LCP 包括前一页面的所有卸载时间、连接设置时间、重定向时间和首字节时间 (TTFB)。Largest Content元素包含如下(详情https://w3c.github.io/largest-contentful-paint/):

  • <img> 元素(第一帧呈现时间适用于 GIF 或动画 PNG 等动画内容)
  • <svg> 元素中的 <image> 元素
  • <video>元素(使用海报图片加载时间或视频的第一帧呈现时间,以时间较短者为准)
  • 使用 url() 函数加载背景图片的元素(而不是 CSS 渐变)
  • 包含文本节点或其他内嵌级文本元素子元素的块级元素。

在计算元素的大小的时候,需要考虑元素的尺寸通常是用户在视口内可见的尺寸。如果元素超出视口范围,或者元素的任何部分被剪裁或具有不可见的溢出,则这些部分不会计入元素的大小;对于已根据固有尺寸调整大小的图片元素,报告的尺寸是可见尺寸或固有尺寸(以较小者为准);对于文本元素,LCP 仅考虑可包含所有文本节点的最小矩形;对于所有元素,LCP 不会考虑使用 CSS 应用的外边距、内边距或边框。

互动性 INP

INP 的目的不是衡量互动的最终影响(例如网络提取和其他异步操作的界面更新),而是衡量下一次绘制被阻塞的时间。延迟视觉反馈可能会给用户造成网页响应速度不够快的印象,而 INP 旨在帮助开发者衡量这部分用户体验。

互动生命周期。在事件处理脚本开始运行之前,会发生输入延迟,这可能由主线程上的长时间任务等因素导致。然后,系统会运行互动事件处理脚本回调,并在显示下一帧之前发生延迟。

通过观察用户访问网页期间发生的所有点击、点按和键盘互动的延迟时间,评估网页对用户互动的总体响应情况。最终 INP 值是观测到的最长互动时间,离群值会被忽略。
互动主要是靠 JavaScript实现的,但浏览器确实可以通过不依赖 JavaScript 的控件(例如复选框、单选按钮和 CSS 控件)提供互动性。对于INP来说仅观察到以下互动类型:

  • 使用鼠标点击。
  • 在带触摸屏的设备上点按。
  • 按实体键盘或屏幕键盘上的按键。

视觉稳定性 CLS

浏览器会查看两个渲染帧之间视口中的不稳定元素的大小和移动情况。布局偏移得分是该移动的两个测量值的乘积:影响百分比和距离百分比

layout shift score = impact fraction * distance fraction

  • impact fraction

    影响比例用于衡量不稳定的元素对两个帧之间的视口区域的影响。指定帧的影响比例是该帧和上一帧中所有不稳定元素的可见区域的组合,以占视口总面积的比例表示。在上图中,有一个元素在一帧中占据了视口的一半。然后,在下一帧中,元素将视口高度向下移动 25%。红色虚线矩形表示元素在两个帧中的可见区域的联合,在本例中,该区域占整个视口的 75%,因此其影响百分比为 0.75。

  • distance fraction


布局偏移得分公式的另一部分用于衡量不稳定元素相对于视口移动的距离。距离比例是任何不稳定元素在帧中移动的最大水平或垂直距离除以视口的最大尺寸(宽度或高度,以较大者为准)。

在此示例中,影响分数为 0.75,距离分数为 0.25,因此布局偏移得分为 0.75 * 0.25 = 0.1875。

全文都是https://web.dev/articles/vitals?hl=zh-cn的一些和笔记,感兴趣可以详读原文

目录
相关文章
|
6月前
|
人工智能 vr&ar 图形学
开源单图生成3D模型TripoSR的局限性分析
【2月更文挑战第25天】开源单图生成3D模型TripoSR的局限性分析
319 6
开源单图生成3D模型TripoSR的局限性分析
|
3月前
|
自然语言处理
MLM在不同语言模型中的表现有何差异?
MLM在不同语言模型中的表现有何差异?
|
11天前
|
机器学习/深度学习 数据采集 数据处理
谷歌提出视觉记忆方法,让大模型训练数据更灵活
谷歌研究人员提出了一种名为“视觉记忆”的方法,结合了深度神经网络的表示能力和数据库的灵活性。该方法将图像分类任务分为图像相似性和搜索两部分,支持灵活添加和删除数据、可解释的决策机制以及大规模数据处理能力。实验结果显示,该方法在多个数据集上取得了优异的性能,如在ImageNet上实现88.5%的top-1准确率。尽管有依赖预训练模型等限制,但视觉记忆为深度学习提供了新的思路。
21 2
|
3月前
|
人工智能 自然语言处理 测试技术
权重、代码、数据集全开源,性能超越Mistral-7B,苹果小模型来了
【8月更文挑战第12天】DCLM是由多家机构联合推出的全新测试平台,旨在通过优化数据集增强语言模型性能。其核心贡献包括一个含240万亿token的标准化语料库及有效的预训练方案。DCLM-BASELINE数据集成功训练出7B参数模型,在MMLU上5-shot准确率达64%,超越Mistral-7B,且计算成本降低40%。尽管存在局限,但该项目已全开源,为社区提供宝贵资源,推动语言模型发展。[论文链接](https://arxiv.org/pdf/2406.11794)
167 60
|
2月前
|
人工智能 开发者
谷歌通过数据增强、对比调优,减少多模态模型幻觉
【9月更文挑战第16天】谷歌研究人员针对多模态大语言模型(MLLMs)中的幻觉问题,提出了一种结合数据增强与对比调优的新方法,旨在减少模型生成错误信息的情况。该方法通过生成式数据增强制造幻觉标记并与真实标记对比,利用对比损失优化模型参数,从而提升模型对真实信息的辨识能力。实验结果显示,此方法能显著降低对象幻觉现象,但在模拟复杂现实场景及计算需求方面仍面临挑战。相关研究已发布在论文《通过数据增强的对比调优减轻对象幻觉》中。
47 3
|
3月前
|
机器学习/深度学习 算法 搜索推荐
支付宝商业化广告算法问题之在DNN模型中,特征的重要性如何评估
支付宝商业化广告算法问题之在DNN模型中,特征的重要性如何评估
|
5月前
|
边缘计算 自然语言处理 安全
谷歌推出AGREE,增强大模型生成回答准确性
【6月更文挑战第19天】谷歌的AGREE技术针对大语言模型(LLMs)的“幻想”回答问题,通过自我接地和引用事实来源提升回答准确性。在多个数据集和模型上的测试显示,AGREE增强了回答和引用的准确性,但无法完全消除错误,且需大量计算资源,还可能涉及隐私和安全问题。[[1](https://arxiv.org/abs/2311.09533)]
48 1
|
存储 Java API
【网安AIGC专题11.7】17ASAP如何更好地改进少样本提示:在LLMs的prompt中添加语义信息,来提高代码摘要生成+代码补全任务的性能。CodeSearchNet数据集(下)
【网安AIGC专题11.7】17ASAP如何更好地改进少样本提示:在LLMs的prompt中添加语义信息,来提高代码摘要生成+代码补全任务的性能。CodeSearchNet数据集(下)
149 0
|
6月前
|
自然语言处理 搜索推荐 算法
如何提升大模型在搜索引擎的性能?
【2月更文挑战第22天】如何提升大模型在搜索引擎的性能?
130 3
如何提升大模型在搜索引擎的性能?
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
再超Transformer!Google提出两个新模型(Griffin、Hawk),强于Mamba,更省资源
【2月更文挑战第15天】再超Transformer!Google提出两个新模型(Griffin、Hawk),强于Mamba,更省资源
268 1
再超Transformer!Google提出两个新模型(Griffin、Hawk),强于Mamba,更省资源

热门文章

最新文章