官方博客-第22页-阿里云开发者社区

子丑

2024-08-26

493

十六年所思所感，聊聊这些年我所经历的 DevOps 系统

从 2008 年开始，我陆陆续续参与了多个 DevOps 系统的建设，如今，审视这些系统的建设初衷和它们的设计思路或遇到的问题，依然有不少借鉴意义。我会按照时间顺序，把每个 DevOps 系统的特点，诞生的背景，以及在当时所主要解决的问题做一个概要的介绍，同时，我们也会以今天的视角再次审视这些问题，来看下同样的问题，经过十几年的发展，解决方案上有哪些不同。

子丑

493

黛忻赵世振

2024-09-23

941

小熊油耗在进行架构升级时，进行了广泛的市场调研，深入分析了国内多家云服务商。经过对比多种 IaaS 层云主机方案及 Serverless 产品的部署策略，他们最终选择了阿里云Serverless 应用引擎 SAE。小熊油耗认为，阿里云能给他们提供更强的安全感，安全感来自于阿里云是一个更大的平台：历史最悠久，用户最多、产品最丰富、配套工具众多、技术支持体系成熟，阿里云 SAE，不仅在稳定性上表现卓越，在细粒度的成本控制和极致的弹性能力上表现也非常出色，而且免运维，完美契合了小熊油耗作为一家细分领域小而美的公司的需求。

黛忻赵世振

941

太业

2024-09-27

856

跟着iLogtail学习容器运行时与K8s下日志采集方案

iLogtail 作为开源可观测数据采集器，对 Kubernetes 环境下日志采集有着非常好的支持，本文跟随 iLogtail 的脚步，了解容器运行时与 K8s 下日志数据采集原理。

太业

856

阿里云云原生

2024-10-18

995

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

995

乘凨

2024-11-29

511

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

为了高效地发现、定位和解决预发问题，闲鱼团队研发了一套异常日志问题自动追踪-定位-分发机制。这套机制通过自动化手段，实现了异常日志的定时扫描、精准定位和自动分发，显著降低了开发和测试的成本，提高了问题解决的效率。

乘凨

511

正己

2025-01-06

350

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

350

赵世振

2025-01-08

1574

阿里云百炼xWaytoAGI共学课 DAY2 - 更好用的文本知识库应用跟学，快速上手阿里云百炼

本课程是阿里云百炼平台的第二天课程内容，旨在帮助用户了解如何通过阿里云百炼构建和发布自己的AI应用。介绍了如何利用大模型和智能体应用来创建具备强大语言理解和生成能力的AI助手，并通过不同的渠道（如网站、钉钉、微信公众号等）发布这些应用。

赵世振

1,574

阿里云云原生

2025-01-10

526

Qwen2.5 的云端新体验，5 分钟完成极速部署

将 Qwen2.5 模型部署于函数计算 FC，用户能依据业务需求调整资源配置，有效应对高并发场景，并通过优化资源配置，如调整实例规格、多 GPU 部署和模型量化来提升推理速度。此外，函数计算支持多样化 GPU 计费模式（按需计费、阶梯定价、极速模式），可根据业务需求调整，在面对高频请求和大规模数据处理时，能够显著降低综合成本。

阿里云云原生

526

牧原

2025-02-21

614

K8S异常诊断之俺的内存呢

本文讲述作者如何解决客户集群中出现的OOM（Out of Memory）和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征，还深入探讨了排查过程中的关键步骤和技术细节。

牧原

614

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

十六年所思所感，聊聊这些年我所经历的 DevOps 系统

降本 60%！小熊油耗使用阿里云 SAE 更加稳定可靠

跟着iLogtail学习容器运行时与K8s下日志采集方案

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

阿里云百炼xWaytoAGI共学课 DAY2 - 更好用的文本知识库应用跟学，快速上手阿里云百炼

Qwen2.5 的云端新体验，5 分钟完成极速部署

K8S异常诊断之俺的内存呢

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

十六年所思所感，聊聊这些年我所经历的 DevOps 系统

降本 60%！小熊油耗使用阿里云 SAE 更加稳定可靠

跟着iLogtail学习容器运行时与K8s下日志采集方案

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

阿里云百炼xWaytoAGI共学课 DAY2 - 更好用的文本知识库应用跟学，快速上手阿里云百炼

Qwen2.5 的云端新体验，5 分钟完成极速部署

K8S异常诊断之俺的内存呢