《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(3)

简介: 《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(3)

《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(2) https://developer.aliyun.com/article/1232306?groupCode=supportservice



4.2.3.3.3 执行阶段(Do)


在执行阶段的流程是:分解原子项目、确定方案、落实到人、优化原子指标。在 里包括两个核心要素:


1、把核心指标相关的工作向下一层分解;


2、在下一层,找到具体的人来执行,这个人要具备将自己负责的指标继续分解 到更细的能力,类似于我们说的树状结构。这样层层地分解下去,每一层的叶子节点 都可以找到对应的负责人。这种“总分”结构,在一本经典教材《金字塔原理》中也 有详细的阐述。


分解原子项目:在本阶段要建立一个完全细化的分级结构,用金字塔原理中的 "MECE重不漏"原则,将工作内容分解到最细的可控粒度。至于按哪个维度进行拆 分,  不同的团队或者业务可能会有不同的原则,  比如有些团队直接按子团队进行分,有些团队按业务进行拆分,有些团队按流程进行拆分。从较多团队通用的角度,  成本控制件事,可以简单的将指标分解到二级指标,包括“自身使用的成本”和“被  分摊的成”。其中,“自身使用的成本”是指,为了满足自己业务的需要,由本技术  团队请或者使用资源产生的成本;“被分摊的成本”是指,由于根据某种计算逻 辑,间接使用了其他团队的资源,为其他技术团队承担一部分成本费用,比如常见的 资源包括公司其他团队开发的广告、投放、风控、安全等系统。如果可以分拆到具体 的系统,则每个系统又可以继续向下拆分到更细粒度的构成项目,每个节点都是一个 小的“总分”结构,按这个逻辑继续向下分解,可以分为“可落地的最细粒度的成本” “可落地的最细粒度的分摊成本”。


再根据开篇描述的方法,确定每个原子的评价指标,无法量化的项目都是“耍流 氓”这样就形成了一个更完整的金字塔结构,如下图所示:


image.png

 

确定方案:  根据上面的金字塔结构,每个原子指标,都需要专业的同学来评价 ,确定如何进行优化。比如,系统主机的成本,主要集中在虚拟机+存储这样的 源上,衡量的指标可以确定为“资源利用率”和“单订单成本”。为了解决“资源利用 率”这个原子指标,就需要考虑目前的空闲机器是否可以下线,在线的服务是否可以 优化或者合并;为了解决“单订单成本”这个指标,可以考虑分析下系统架构,跟核 心流程处理有关的服务是否可以更加高效或者抽象出来成为服务中台,这样就可以释 放一些"烟囱式"的建设资源,使得核心处理能力更加集中、高效。类似这样将所有的 解决方案整合起来,就形成了最后的解决方


到人:  有了方案之后,一定要确定唯一的Owner(主R),根据经验,主R 有一个会比较好,否则会造成“责”、“权”、“利”分割不清。在这个过程中,也是 团队技术能力和架构能力的好机会。


指标:  不同的方案,实施的周期和代价不同,各个主R深入到不同专业 后,会对目前的资源指标有分析和反馈。有可能理论上所有的指标都需要优化,也有 可能些指标已经很好了,这时候要甄别出来哪些资源指标的实施“杠杆率”比较 高。建议应用80/20原则进行分析,即某些指标投入20%的资源和精力可以解决 后80%的核心问题,保证投入适合的工作量带来较高的产出。对于没有解决方资源或者实施难度过大的资源,建议果断放弃或者搁置。

 

在具体实践中,我们可以把以上的过程,再次用一个金字塔结构来表述,如下图所示:


image.png


建立了以上的结构,就可以根据各个专业的不同,对各自的指标进行优化了,如 果最细一级的指标被成功优化之后,最上层的指标一定会有下降。因为上述指标都有 其各自深层次的业务、技术,甚至是财务上的逻辑,故在此把一些需要关注的概念再 赘述一下。


很多公司每个技术团队的机器成本,在财务上叫做“网站运维成本”,从顶层可 以分为两构成因素,就是“自己产生的成本”和“被分摊的成本”两大类。跟自己有 关的继续向下钻取,可以分为交易相关的资源成本(跟业务流程相关的)以及跟分析有 关的大数据成本(分析、算法、决策相关)。

 

4.2.3.3.4 检查(Check)


在这个段,建议关注以下结果:


规定动作检查:规定的方案是否执行?相关的同学是否按照规定的动作进行了 相对应的行动?  这个阶段只关注过程不关注结果,而且更多的是关注执行人、配合 方、时间点,用项目管理的思路来运营。

 

结果评估:之前梳理出来的指标是否得到了优化?这个过程是在验证结果,各 项指标中得到优化和未优化的都要整理出详细的List,  有些指标如“资源利用率”是立 即可以查看结果的,有些结果是需要周期性的时间才能获得。在这个基础上可以继续 深入反向思考,按“指标定义是否有问题->方案制定是否有问题->执行人是否有问题 ->配合方是否有问题”这个流程来进行评估


系统问题定位:在这个过程中,可以做到小范围闭环,建议针对某个指标的优 化方案可以设计多套,方案A不行马上迭代成方案B,快速试错,找到合理的方案。


修正标准动作:在执行的过程中,很多方案和动作,都是在一线现场发现和修 正的,不需要等待大规模复盘时候再提出问题和总结,主R要具备这样的意识,在 执行过程中多说多问,找到关键要素,相信每个同学都有过这样的经历。经历过某个 完整项目生命周期的同学,往往也是团队内成长最快的骨干。

 

4.2.3.3.5 复盘总结,继续迭代(Act)


定期复盘:复盘是一个非常重要的能力,个人以为,复盘总结的能力在某种程 度上也代表了自己的“抽象能力+思考能力+管理能力”,关于复盘的方法论书多,这里再进行赘述。在这个阶段,个人建议关注的点在于两个“知道”:“知道自 己不知道”,通过复盘掌握了成本优化的方法、框架、方案、团队素质、结果;“不 知道自己知道”,通过一些结果,知道了自己原来一直是在正确的道路上还是在错误 的道上前进,把带有“运气”成分的成功,升华成为一种未来的“习惯性成功”。


形成报告:让第一次看到这个报告的人,也能通过一两次实践,学会成本优化 这件事。


•迭认知:将之前的过程开始深化和迭代,也是再次进行PDCA的过程,反复 打磨自己的抽象能力、思考能力、管理能力,  使自己工作深度、广度的ROI继续 升。在迭代过程中,总会有一些惊喜和收获。从个人来说,原来以为成本项目仅仅是 个管理项目,在不断通过技术手段取得成本优化的过程中,收获了对架构、技术的理 解,  并且很多时候需要用创新的手段来解决前人未曾突破的问题,  另外还收获了7项 跟架构升级、数据压缩、技术处理有关技术专利,也是技术能力提升的一个佐证。




《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.2 社交流量潮汐性——4.2.3 云上成本优化(4) https://developer.aliyun.com/article/1232304?groupCode=supportservice

 

 

相关文章
|
9天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
10天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
770 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
10天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
798 7
|
10天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
10天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2100 4
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
10天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
768 150
|
10天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
1814 6
|
10天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
619 2

热门文章

最新文章