官方博客-第28页-阿里云开发者社区

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

ModelScope

2024-05-15

1107

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,107

斜阳

2024-05-16

740

浅谈现代消息队列与云存储

讲述消息系统在现代化演进中软硬一体化，百万队列，分级存储等诸多竞争力特性的诞生和落地效果。探讨业界领先的 Shared-Log 存储计算分离，FFM与协程，RDMA 传输，列式存储等技术，将消息向流的领域延伸。

斜阳

740

邢云阳

2024-08-20

19101

AI 网关零代码解决 AI 幻觉问题

本文主要介绍了 AI Agent 的背景，概念，探讨了 AI Agent 网关插件的使用方法，效果以及实现原理。

邢云阳

19,101

资源编排ROS

2024-09-10

216

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

在虚拟游戏的世界里，数字化的乐趣谱写着无数玩家的回忆。本文将指导您使用阿里云ROS CDK轻松将2048小游戏部署到云端。ROS CDK是一种强大的工具，允许您使用熟悉的编程语言定义和部署云资源，简化开发流程。此外，ECS（弹性计算服务）为您提供灵活且可扩展的计算资源，确保应用稳定运行。通过简单的环境配置和依赖安装，您可以快速创建和管理云资源，实现从本地到云端的无缝迁移。跟随本文指引，您将学会如何使用ROS CDK和ECS部署2048小游戏，并享受云端游戏的乐趣。

资源编排ROS

216

重彦

2024-09-25

684

深入探索 RUM 与全链路追踪：优化数字体验的利器

本文主要介绍了基于 OpenTeletemetry 与 W3C 协议构建端到端全链路的解决方案，同时探讨了 RUM 与端到端链路集成的最佳实践，希望可以为大家在生产环境落地应用提供一些参考。

重彦

684

迅飞

2024-09-30

635

iLogtail 进化论：重塑可观测采集的技术边界

iLogtail 作为一款开创性的轻量级日志采集器，历经 13 载风雨，始终致力于高效地从多元化的数据源中萃取、处理可观测信息，并无缝传输至阿里云日志服务或各类日志分析平台。今年，适逢 iLogtail 开源两周年的里程碑时刻，我们将回顾 iLogtail 的技术演进之路，领略其不断突破边界、引领可观测采集未来的创新力量。

迅飞

635

铖朴层风

2024-11-06

1038

10 倍性能提升， GraalVM 应用可观测实践

本文介绍了 GraalVM 静态编译技术在云原生环境下的应用：ARMS 发布了支持 GraalVM 应用的 Java Agent 探针，可为 GraalVM 应用提供开箱即用的可观测能力。同时，文章还提供了使用 ARMS 对 GraalVM 应用进行可观测的详细步骤。

铖朴层风

1,038

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

612

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

612

官方博客-第28页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

浅谈现代消息队列与云存储

AI 网关零代码解决 AI 幻觉问题

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

深入探索 RUM 与全链路追踪：优化数字体验的利器

iLogtail 进化论：重塑可观测采集的技术边界

10 倍性能提升， GraalVM 应用可观测实践

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

官方博客-第28页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

浅谈现代消息队列与云存储

AI 网关零代码解决 AI 幻觉问题

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

深入探索 RUM 与全链路追踪：优化数字体验的利器

iLogtail 进化论：重塑可观测采集的技术边界

10 倍性能提升， GraalVM 应用可观测实践

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性