官方博客-第14页-阿里云开发者社区

望雲十雨言澈

2025-04-10

559

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

559

任庆盛

2023-02-22

23173

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

23,173

澄潭钰诚

2024-07-19

21946

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

21,946

龙蜥社区OpenAnolis

2024-11-06

2922

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

机密计算软硬结合技术保障数据安全。

龙蜥社区OpenAnolis

2,922

昱临

2024-11-14

1051

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,051

羿莉

2025-01-14

673

网络安全视角：从地域到账号的阿里云日志审计实践

日志审计的必要性在于其能够帮助企业和组织落实法律要求，打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用，一方面是选择国家网络安全专用认证的日志分析产品，另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外，还可通过报表分析和告警配置，主动发现潜在的安全威胁，增强云上资产安全。

羿莉

673

ModelScope

2024-05-15

1155

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,155

古琦

2024-07-04

109501

全链路追踪 & 性能监控，GO 应用可观测全面升级

当前，大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入，需要开放人员手动进行埋点，会存在一定问题。对此，可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案，能通过无侵入的方式实现应用监控能力。

古琦

109,501

阿里云云原生

2025-01-24

797

智能理解 PPT 内容，快速生成讲解视频

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

阿里云云原生

797

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

Flink CDC+Kafka 加速业务实时化

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

网络安全视角：从地域到账号的阿里云日志审计实践

vLLM部署Yuan2.0：高吞吐、更便捷

全链路追踪 & 性能监控，GO 应用可观测全面升级

智能理解 PPT 内容，快速生成讲解视频

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

Flink CDC+Kafka 加速业务实时化

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

网络安全视角：从地域到账号的阿里云日志审计实践

vLLM部署Yuan2.0：高吞吐、更便捷

全链路追踪 & 性能监控，GO 应用可观测全面升级

智能理解 PPT 内容，快速生成讲解视频

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结