官方博客-第16页-阿里云开发者社区

阿里云云原生

2024-11-01

982

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

982

信徒

2024-12-05

839

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

本文详细记录了作者在处理HSF调用异常问题的过程中，从初步怀疑死锁到最终发现并解决活锁问题的全过程。

信徒

839

羿莉

2024-12-26

800

网络安全视角：从地域到账号的阿里云日志审计实践

日志审计的必要性在于其能够帮助企业和组织落实法律要求，打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用，一方面是选择国家网络安全专用认证的日志分析产品，另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外，还可通过报表分析和告警配置，主动发现潜在的安全威胁，增强云上资产安全。

羿莉

800

阿里云弹性计算

2025-01-06

171770

对话｜企业如何构建更完善的容器供应链安全防护体系

阿里云与企业共筑容器供应链安全

阿里云弹性计算

171,770

阿里云云原生

2025-04-28

715

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

715

阿里云云原生

2025-04-29

686

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

686

达领

2023-04-23

25781

慢SQL是如何拖垮数据库的

本文结合一个实际故障案例出发，分析慢SQL是如何打垮数据库并引发故障的。

达领

25,781

栾枝

2023-07-18

131019

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

131,019

德歌

2023-09-22

1735

沉浸式学习PostgreSQL|PolarDB 17: 向量数据库, 通义大模型AI的外脑

本文所涉及的实验体验的就是怎么建设AI的外脑?向量数据库的核心价值:AI外脑

德歌

1,735

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

网络安全视角：从地域到账号的阿里云日志审计实践

对话｜企业如何构建更完善的容器供应链安全防护体系

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

慢SQL是如何拖垮数据库的

手把手教你使用OSS-HDFS服务平替自建HDFS

沉浸式学习PostgreSQL|PolarDB 17: 向量数据库, 通义大模型AI的外脑

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

网络安全视角：从地域到账号的阿里云日志审计实践

对话｜企业如何构建更完善的容器供应链安全防护体系

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

慢SQL是如何拖垮数据库的

手把手教你使用OSS-HDFS服务平替自建HDFS

沉浸式学习PostgreSQL|PolarDB 17: 向量数据库, 通义大模型AI的外脑