【云故事探索】NO.17:国诚投顾的云原生Serverless实践

本文涉及的产品
函数计算FC,每月15万CU 3个月
简介: 简介: 通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。

依托阿里云 Serverless 架构,我们构建了高弹性、智能化的技术底座,实现了业务系统的稳定、高效运行。未来,我们将持续深化云原生技术实践,以全链路数字化能力赋能行业生态,为投资者打造更敏捷、安全的智能投顾服务平台,引领行业数字化变革新范式。”

——国诚投顾 副总经理 石旦

在数字化转型的浪潮中,深圳市国诚投资咨询有限公司携手阿里云,选择将 Serverless 应用引擎(SAE)作为其技术架构的核心支撑平台,该举措便取得了显著成效。通过基于 SAE 的全量迁移和 Serveless 整体架构,企业不仅大幅提升了业务系统的稳定性与运行效率,还在成本控制方面实现了质的飞跃。

借助云原生 API 网关,企业实现了对外服务的统一接入与精细化流量管理,提升了接口调用的安全性与可观测性;同时,结合微服务治理能力,系统在服务发现、负载均衡、熔断限流等方面具备了更强的弹性和自动化运维水平。尤其在高并发场景下,整体架构展现出优异的高可用性与稳定性,有效破解了原有系统中的性能瓶颈,全面支撑起业务的高效运转与未来持续扩展需求。

客户介绍

深圳市国诚投资咨询有限公司(简称“国诚投顾”)成立于 2004 年,是一家完全依靠市场竞争成长起来的专业投资咨询机构。20 年来,公司秉承规范、诚信、创新的宗旨,致力于打造集合精品投研资讯、投资者教育、选股决策辅助的综合互联网产品,立足专业的深度调研,帮助客户构建自己的盈利体系,提高自身投资能力。公司以专业化的投研体系为根基,结合前沿创新科技,实现传统投顾经验智慧与智能投顾数据算力的双向融合,为中小投资者提供全周期的投资决策辅助方案。

2024 年,国诚投顾发布自研智能投顾软件“决策家”,一款汇聚专业投研团队提供指导建议的可视化交易决策辅助工具,成为中小投资者信赖的智能投顾标杆产品。

业务挑战

在之前,国诚投顾全栈系统主要搭建在 ECS 之上,业务高峰期前需要预先扩容机器来应对预期外的流量。同时中间件也在 ECS 上自建微服务网关,负责南北方向流量调度、安全防护以及微服务治理,配合服务注册配置中心实现服务间调用、配置管理和变更推送,很好地支撑了国诚投顾前期的业务快速增长。

但随着业务的高速发展,原本的这套技术架构逐渐暴露出诸多问题:

1. 稳定性挑战日益突出

随着业务访问量逐年增长,尤其是在行情波动或市场热点事件期间,平台面临巨大的并发访问压力。由于微服务网关、注册中心等关键组件均以自建形式部署于 ECS 上,集群稳定性难以保障。面对高频访问和突发流量冲击,经常出现服务响应延迟、调用链异常甚至部分服务不可用的情况。同时,由于缺乏完善的监控体系与自动恢复机制,一旦发生故障,问题定位复杂、排查周期长,严重影响业务连续性。自建中间件的高维护门槛也使得稳定性优化工作滞后于业务增长速度,成为阻碍系统持续演进的关键瓶颈。

2. 资源弹性能力不足,利用率低下

传统 ECS 架构下,资源扩容依赖人工操作或定时任务,在流量突增时往往无法及时响应,导致系统过载、请求堆积甚至系统雪崩的严重问题。而在业务低谷期,大量 ECS、容器实例处于闲置状态,资源利用率偏低,造成不必要的成本支出。此外,由于缺乏对实际业务流量曲线的动态感知能力,企业在资源规划上多采用“预留冗余”的方式,导致长期存在资源浪费现象,既增加了运维成本,又降低了资源使用的灵活性与效率。

3. 运维复杂度高,人力投入大

ECS、容器集群的日常运维涉及节点管理、网络配置、中间件部署、日志收集等多个环节,整个系统依赖大量专业人员进行维护。例如 Kubernetes 集群的搭建与调优、微服务网关的版本更新、服务注册中心的维护等,都需要具备较高技术水平的开发和运维团队参与。特别是在面对复杂的故障场景时,排查过程繁琐、调试难度大,响应效率远不能满足业务快速变化的需求。这种高门槛、高人力成本的运维模式,严重限制了企业的敏捷性和创新能力。

4. 发布流程低效,缺乏灵活发布机制

随着业务需求不断变化,频繁的功能迭代和版本发布已成为常态。但在原有的 ECS 和部分容器架构下,每次发布都需要逐台登录服务器进行代码更新,不仅耗时长、效率低,还极易因人为操作失误导致发布失败或服务异常。更关键的是,该架构缺乏现代应用所需的滚动发布、灰度发布、A/B 测试等高级发布能力,也没有完善的一键回滚机制。一旦新版本上线后发现问题,修复成本极高,且容易引发更大范围的服务中断,影响用户体验和品牌口碑。

5. 缺乏统一的技术中台支撑

随着业务模块不断增加,各系统之间的耦合度越来越高,但缺乏统一的技术中台进行集中管理和协同调度。不同业务线各自为政,重复建设中间件和服务组件,导致技术栈分散、标准不一,进一步加大了系统集成与协同开发的难度,API 管理的成本大幅度上升。同时,缺乏统一的日志分析、监控告警、链路追踪等可观测性能力,使得系统整体运行状态难以全面掌握,影响了故障预警和性能调优的效率。


综上所述,国诚投顾亟需一套更加现代化、云原生化、智能化的技术架构来替代传统的 ECS 、容器化自建方案,以应对当前业务快速发展带来的多重挑战。新的架构不仅要具备更高的稳定性、弹性和可维护性,还需支持高效的发布机制和统一的技术治理能力,从而全面提升平台的可用性、扩展性与运维效率,为企业未来的数字化转型和业务创新提供坚实的技术底座。

构建云原生 Serverless 架构,驱动国诚投顾技术升级

为应对上述挑战,深圳市国诚投资咨询有限公司携手阿里云,基于云原生理念打造了一套全新的技术架构。该方案以 Serverless 应用引擎(SAE)为核心平台,结合云原生 API 网关、MSE 微服务治理引擎、ARMS 应用监控、SLS 日志服务等多项阿里云产品,全面重构了原有的 ECS、容器自建架构,实现了从传统运维模式向现代化云原生架构的平滑演进。

1. 全量迁移至 Serverless 应用引擎(SAE),实现资源弹性与自动伸缩

国诚投顾将原有部署在 ECS、容器上的业务系统逐步迁移至阿里云 SAE 平台。SAE 提供开箱即用的 Serverless 容器运行环境,无需管理底层服务器资源,系统可根据实时流量自动进行弹性扩缩容,极大提升了系统的响应能力和资源利用率。

  • 智能弹性扩容:SAE 支持秒级弹性扩容,有效应对突发流量冲击,避免因容量不足导致的服务不可用。
  • 资源按需计费:仅按实际使用资源付费,大幅降低闲置资源带来的成本浪费。
  • 零运维门槛:告别繁琐的节点维护和集群管理,让团队更专注于业务开发与创新。

2. 引入云原生 API 网关,统一南北向流量治理

针对原有自建网关稳定性差、功能单一的问题,国诚投顾采用阿里云云原生 API 网关替代原有微服务网关,作为对外服务的统一入口。

  • 统一接入层:集中管理所有 API 接口,支持多种协议(HTTP/HTTPS/gRPC 等),提升接口调用的安全性与 API 的可管理性。
  • 精细化流量控制:支持限流、鉴权、缓存、日志分析等功能,保障核心接口稳定运行。
  • 高可用部署:API 网关天然具备跨可用区容灾能力,保障业务连续性和访问稳定性。

3. 微服务治理体系全面升级,构建高可用分布式架构

通过集成阿里云 MSE(微服务引擎)国诚投顾实现了微服务架构的深度优化。

  • 服务注册与发现:基于 Nacos 的服务注册中心,确保服务间高效通信。
  • 服务治理能力增强:包括负载均衡、熔断降级、链路追踪等,全面提升系统健壮性。
  • 多语言支持:兼容 Java、Go、Python 等主流语言,满足不同业务模块的技术需求。
  • 灰度发布能力:支持金丝雀发布、A/B 测试等高级发布策略,显著降低上线风险。

4. 构建可观测体系,提升系统透明度与故障响应效率

借助阿里云 ARMS 应用实时监控服务SLS 日志服务 ,国诚投顾建立了完整的可观测性体系:

  • 链路追踪(Tracing):对请求链路进行端到端跟踪,快速定位性能瓶颈与异常点。
  • 指标监控(Metrics):实时展示 CPU、内存、QPS、错误率等关键指标,辅助运维决策。
  • 日志集中管理(Logging):统一收集、存储并分析各业务模块日志,提高排障效率。

5. 自动化 DevOps 体系,提升发布效率与质量

为解决原有发布流程低效、易出错的问题,国诚投顾基于阿里云 DevOps 平台 CodePipeline + CodeBuild + Jenkins 插件集成,构建了完整的 CI/CD 流水线:

  • 代码提交 → 构建 → 测试 → 发布全流程自动化
  • 支持滚动发布、蓝绿部署、灰度发布等多种策略
  • 一键回滚机制,快速修复线上问题,保障用户体验
  • 与 SAE 深度集成,实现无缝部署与版本管理

升级后架构图

业务价值

成本效益显著提升:弹性资源 + 按需使用,大幅降本增效

借助阿里云 Serverless 应用引擎(SAE)的智能弹性策略,国诚投顾能够灵活应对周期性业务高峰,无需提前预估容量、手动扩容。SAE 支持自动扩缩容,且支持开发测试环境一键启停,极大提升了资源利用率。

  • 整体成本下降,有效避免了传统 ECS 架构下因资源预留导致的浪费;
  • 资源申请与部署流程从“天级”缩短至“分钟级”,运维团队压力显著降低;
  • 团队整体工作效率提升约 40%,助力业务快速迭代与上线。
  • 整体资源利用率提升近 50%,告别“资源闲置”与“资源不足”的两难局面;
  • 结合 Serverless 的按量计费模式,企业真正做到“用多少付多少”,进一步压缩 IT 运营成本。

可观测体系建设完善,系统运行状态一目了然

SAE 平台原生集成阿里云 ARMS、MSE、SLS 等监控与高可用能力,为国诚投顾构建了一套完整的可观测体系。

  • 实现了对应用性能、调用链路、异常日志等关键指标的实时监控;
  • 故障定位速度提升 30%,Bug 处理效率显著提高;
  • 从请求入口到微服务内部调用,端到端可视化呈现,便于快速排查问题;
  • 运维和开发团队响应更敏捷,系统稳定性与服务质量持续优化。

API 管理能力全面升级,统一入口治理更高效

通过引入阿里云云原生 API 网关,国诚投顾实现了对外服务接口的统一接入与集中管理。

  • 结合 API First 开发实践和 API 管理能力的优势,提升系统开发部署运维的效率;
  • 提供鉴权、限流、缓存、日志分析等功能,保障核心服务的安全与稳定;
  • 支持多协议、多版本 API 管理,满足复杂业务场景下的灵活扩展需求;
  • 接口发布、变更、灰度上线流程标准化,提升 API 治理效率与可维护性。

总结

通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。

这一转型不仅为企业带来了更高的系统稳定性、更低的运营成本和更快的业务响应速度,更为未来的数字化创新、智能化升级和规模化扩展打下了坚实的技术基础。

2025 年,国诚投顾与阿里云进一步达成深度合作,成为国内率先接入阿里云全栈自主研发 AI 技术的证券投资顾问机构,借助阿里云强大的云计算能力和先进的 AI 算法模型,国诚投顾将实现在产品服务、客户服务、业务运营、智能合规管理、智慧投研以及智能风控等多个关键领域的优化升级。随着数智化转型全面推进,国诚投顾在各业务场景应用中积极拥抱大模型,深度融合大模型技术与自身投研逻辑,显著提升业务效能与客户服务体验。

点击 https://www.aliyun.com/product/aliware/sae,了解阿里云SAE更多应用场景



来源  |  云布道师公众号


相关实践学习
【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
本次实验基于阿里云函数计算产品能力开发AI绘画平台,可让您实现“破次元壁”与角色合照,为角色换背景效果,用AI绘图技术绘出属于自己的少年江湖。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
相关文章
|
6天前
|
人工智能 弹性计算 自然语言处理
云速搭 AI 助理发布:对话式生成可部署的阿里云架构图
阿里云云速搭 CADT(Cloud Architect Design Tools)推出智能化升级——云小搭,一款基于大模型的 AI 云架构助手,致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。
193 26
|
20天前
|
Kubernetes 安全 Devops
「迁移急救包」全云平台无缝迁移云效实操手册
阿里云云效是国内领先的一站式DevOps平台,提供代码全生命周期管理、智能化交付流水线及精细化研发管控,支持多种开发场景。本文详细介绍了从其他平台(如Coding)向云效迁移的完整方案,包括代码仓库、流水线、制品仓库及项目数据的迁移步骤,帮助用户实现高效、安全的平滑迁移,提升研发效率与协作能力。
308 29
|
2月前
|
机器学习/深度学习 人工智能 算法
面向工业4.0的AI Agent多任务协作与调度系统设计
随着人工智能(AI)技术的飞速发展,智能制造成为现代工业的核心驱动力。传统制造系统在面对多任务、高频次和动态变化的调度需求时,往往效率低下。而基于AI Agent的多任务协作与调度机制为解决这一问题提供了全新思路。本文聚焦于面向智能制造场景中,如何通过AI Agent实现多任务协作调度,并引入强化学习方法进行算法优化。
|
10天前
|
存储 运维 安全
阿里云国际站OSS与自建存储的区别
阿里云国际站对象存储OSS提供海量、安全、低成本的云存储解决方案。相比自建存储,OSS具备易用性强、稳定性高、安全性好、成本更低等优势,支持无限扩展、自动冗余、多层防护及丰富增值服务,助力企业高效管理数据。
|
14天前
|
存储 弹性计算 运维
阿里云服务器介绍:什么是ECS、使用场景及租用流程(图解)
阿里云服务器ECS是阿里云提供的虚拟化计算服务,用户可按需租赁使用,无需自建机房。它具备高可用、高安全、弹性伸缩、成本节约等优势,适用于网站搭建、数据应用、运维测试等多种场景。本文详解ECS组成、架构、使用方法及与传统服务器的区别。
151 3
|
18天前
|
SQL 人工智能 JSON
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理
本文整理自阿里云的高级技术专家、Apache Flink PMC 成员李麟老师在 Flink Forward Asia 2025 新加坡[1]站 —— 实时 AI 专场中的分享。将带来关于 Flink 2.1 版本中 SQL 在实时数据处理和 AI 方面进展的话题。
107 0
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理
|
18天前
|
物联网 开发者
LoRA 模型的全新玩法——AutoLoRA 带你体验 LoRA 检索与融合的魔法
LoRA 模型的全新玩法——AutoLoRA 带你体验 LoRA 检索与融合的魔法
156 0
|
13天前
|
机器学习/深度学习 编解码 人工智能
102类农业害虫数据集(20000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
在现代农业发展中,病虫害监测与防治 始终是保障粮食安全和提高农作物产量的关键环节。传统的害虫识别主要依赖人工观察与统计,不仅效率低下,而且容易受到主观经验、环境条件等因素的影响,导致识别准确率不足。
|
13天前
|
消息中间件 自然语言处理 运维
微服务不是银弹!这4个设计原则让你少踩90%的坑
本文深入解析微服务架构与领域驱动设计(DDD)的核心理念与实践方法,帮助开发者正确拆分服务边界,避免常见误区,提升系统可维护性与扩展性,适用于复杂业务场景下的高效开发与团队协作。
113 1