子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,049

章磊

2023-08-15

21594

迄今为止最完整的DDD实践

对于一个架构师来说，在软件开发中如何降低系统复杂度是一个永恒的挑战。

章磊

21,594

闵子

2023-12-01

1062

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

1,062

郑嘉扬何杉

2024-05-15

58764

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

享道出行利用阿里云容器服务ACK，结合AHPA智能弹性与ECS、ECI混合部署，解决了业务潮汐效应带来的弹性滞后和成本问题。

郑嘉扬何杉

58,764

隆基

2024-05-15

108416

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

108,416

阿里云云原生

2024-07-29

117

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

117

徽泠

2024-06-27

33344

基于阿里云 OpenAPI 插件，让 Grafana 轻松实现云上数据可视化

本文旨在提供一个指导性的框架，帮助用户了解插件的安装、配置以及探索如何通过 Grafana 内的阿里云 OpenAPI 插件来对云上数据进行可视化和快速验证开发原型，加强数据可视化和云监控能力，助力开发速度。

徽泠

33,344

探索云世界

2024-05-15

514

云效流水线+ECS服务器，自动化部署Web页面

本文主要介绍如何通过使用ECS服务器与npm，结合云效的流水线服务以仓库代码提交为触发方式，进行了基于Vue的Web网页部署。

探索云世界

514

望宸彦林

2024-06-24

50651

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,651

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

迄今为止最完整的DDD实践

从浏览器原理出发聊聊Chrome插件

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

从供应商深度绑定，到走向真正的云原生，他们是这样做的

基于阿里云 OpenAPI 插件，让 Grafana 轻松实现云上数据可视化

云效流水线+ECS服务器，自动化部署Web页面

从云原生视角看 AI 原生应用架构的实践