节省 58% IT 成本,调用函数计算超过 30 亿次,石墨文档的 Serverless 实践

本文涉及的产品
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
应用实时监控服务-用户体验监控,每月100OCU免费额度
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 云原生时代,逐渐完善的 IT 基础设施,让企业能更高效地进行数字化创新。

作者:金中茜


对石墨文档来说,“用户体验、成本消耗、上线速度”是决定能否在茫茫商海展露头角的重要因素。它需要一套弹性高可用、分布式的服务来实时处理文档编辑冲突:既要保证成本可接受,又要保证在负载突增时平滑处理峰值负载,实现毫秒级别的文档同步响应。


2021 年 7 月 20 日,一场特大暴雨打破了河南的宁静,也牵动着全国人民的心。


当晚,大量河南暴雨的信息开始在各类社交媒体急速传播,“待救援人员名单”“救援现场信息”“住宿交通物资信息”......一个个在线文档承载着一条条救命信息。石墨文档在第一时间向抗汛一线的政府部门、医疗机构、公益组织、社会志愿者们提供了免费的高级版产品和服务。


两周内,全国共创建了超过 1600 个灾情协同文档,累积为数百万设备提供了在线协同服务,让抗汛的现场救援、物资运输、医疗及志愿者组织都更加高效。同时,也让石墨文档背后的 IT 系统面临着巨大挑战,尤其是:如何保证系统的平稳运行。


只有系统平稳的运行,才能让更多人参与到文档协作中,第一时间对各类救命文档进行整理、编辑、归纳,让救命信息及时传递出去。


石墨文档经受住了这次极端流量的考验,背后是五个月前便在阿里云上构建了一套智能运维系统,打通了系统全链路可观测数据,实现统一管理,智能告警和提前预检。


灾情一发生,石墨文档团队工程师就接到告警电话,语音自动播报石墨线上 K8S(Kubernetes,容器管控系统)集群资源使用率飙升,PV(Page View,页面浏览量)同比增加 200%以上;某些业务接口访问量骤增,多个资源即将到达压力位告警,原来是多个文档的读写次数和访问人数出现异常增多。


由于短期访问人数激增,且无法准确判断后续上涨趋势,工程师快速协调了数倍于往日的阿里云计算资源对基础设施进行了大规模扩容,确保这些救灾文档在数千人同时协作,数百万人次浏览的情况下也能保持稳定、流畅的体验,从而保障救灾工作顺利进行。


最终,石墨文档出色完成了作为“信息载体”的任务,文档始终稳定可用。


能够快速应对极端情况下的流量压力,还有赖于石墨文档一直以来的技术积累。自 2014 年成立至今,石墨文档累计服务超过 20 万家企业,在 IT 层面主要面临两大挑战。


一是多用户实时协作。为了支持多用户多终端实时在线编写,石墨文档技术团队对 OperationalTransformation 算法进行了非常深入的探索和修改,解决了一段文字被多个客户端同时修改所引起的冲突问题。


但这会带来第二个挑战,就是多用户实时编辑对服务器带来的巨大压力。用户敲击键盘输入一个文字只需几毫秒,但如果是大量用户在石墨文档上同时编写文档,就很容易出现在一个很小时间段内数据分布不均的情况,一个直观的体现就是“写串行”。


对石墨文档来说,“用户体验、成本消耗、上线速度”是决定能否在茫茫商海展露头角的重要因素。它需要一套弹性高可用、分布式的服务来实时处理文档编辑冲突:既要保证成本可接受,又要保证在负载突增时平滑处理峰值负载,实现毫秒级别的文档同步响应。


为此,石墨文档与阿里云进行深度合作,借助公共云 Serverless 架构来应对流量挑战。


函数计算是阿里云提供的 Serverless 服务,根据请求量动态分配执行环境,毫秒级调度计算资源,确保在负载高时保持稳定的延时,在负载低时有着较高的资源利用率,且只会对代码运行时使用的计算资源付费。


石墨文档使用函数计算搭建文档实时编辑服务,由函数计算的智能调度系统自动分配执行环境,处理多用户同时编写文档带来的峰值负载,函数计算的动态扩缩容能力保障应用的可靠运行。


借助函数计算毫秒级别的资源伸缩能力,石墨文档解决了高峰期负载突增的计算资源扩容问题,相比于自建机房维护服务器,节省了 58%的 IT 成本,目前石墨文档每月调用函数计算超过 30 亿次。


云原生时代,逐渐完善的 IT 基础设施,让企业能更高效地进行数字化创新。


由于不用再考虑 CPU 密集型计算的负载均衡问题,不仅开发的稳定性提高了,各个项目的迭代与上线的步伐也快了起来。作为中国第一款支持云端协作的企业办公服务软件,石墨文档实现了以毫秒级同步响应速度,来实现多成员多终端的在线实时协作,强大稳定的技术支撑着平台高效稳定的服务体验,也正激发更大想象空间。


借助阿里云函数计算极致弹性,石墨文档发布“远程办公版”,为企业带来一系列远程办公模板。这些模板使用方便,实现多人多地在线实时办公。更进一步,12 月 1 日,在“重塑在线办公”的主题下,石墨文档正式推出为企业和组织打造的国产企业级云端 Office——石墨办公,向更广阔的市场迈出关键一步。


石墨团队一直围绕企业文档协同的需求不断创新,这为未来的办公协同模式,进行了重要探索。


相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
1月前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
88 1
|
1月前
|
运维 监控 Serverless
Serverless架构在图像处理等计算密集型应用中展现了显著的优势
Serverless架构在图像处理等计算密集型应用中展现了显著的优势
38 1
|
2月前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
63 3
|
2月前
|
运维 Serverless 数据处理
Serverless架构在图像处理等计算密集型应用中展现了显著的优势
Serverless架构在图像处理等计算密集型应用中展现出显著优势,包括加速研发交付、降低成本、零运维成本、高效资源利用、自动扩展、实时数据处理及快速原型开发,为高并发、动态需求场景提供高效解决方案。
65 1
|
2月前
|
运维 Serverless 数据处理
Serverless架构在图像处理等计算密集型应用中展现出显著优势
【10月更文挑战第6天】Serverless架构在图像处理等计算密集型应用中展现出显著优势,包括加速研发交付、成本效益、零运维成本、高效资源利用、自动扩展能力、实时数据处理及快速原型开发,为高并发、动态需求场景提供高效、灵活的解决方案。
49 4
|
6月前
|
运维 Serverless 数据库
函数计算产品使用问题之如何并行运算函数计算任务,并对任务计算后的结果再进行聚合运算
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
|
2月前
|
监控 Serverless 云计算
探索Serverless架构:无服务器计算的新纪元
Serverless架构作为云计算的新范式,让开发者无需管理服务器即可构建和运行应用,从而专注于代码开发。其核心优势包括成本效益、自动扩展及高效部署。通过事件驱动模型和微服务部署,开发者按需付费,减少了资源浪费。尽管面临冷启动、状态管理和调试等挑战,Serverless架构仍凭借其高效性与可扩展性展现出广阔的应用前景。流行平台如AWS Lambda、Azure Functions等使其实施更为便捷。
|
4月前
|
数据可视化 NoSQL Serverless
现代化 Web 应用构建问题之Serverless架构的Web站点费用计算如何解决
现代化 Web 应用构建问题之Serverless架构的Web站点费用计算如何解决
53 1
|
4月前
|
运维 监控 Serverless
什么是无服务器计算?
【8月更文挑战第13天】
125 5
|
4月前
|
运维 Cloud Native 云计算
云原生架构的演进:从微服务到无服务器计算
在数字化转型的浪潮中,云原生技术以其灵活性、可扩展性和成本效益性,成为推动现代软件开发和运维的关键力量。本文将探讨云原生概念的演变,特别是从微服务架构到无服务器计算的转变,揭示这一进化如何影响应用程序的开发、部署和管理。通过分析实际案例,我们旨在提供对云原生技术未来趋势的洞察,同时指出企业在这一转变过程中可能面临的挑战和机遇。
55 2

相关产品

  • 函数计算