官方博客-第3页-阿里云开发者社区

子白

2024-05-15

102600

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,600

吴昆

2024-05-15

222171

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,171

硅步

2024-09-27

1022

灵魂拷问-前端的作用--性能优化篇

作者最近在尝试对负责的平台进行性能优化，本文整理了些前端性能优化的一些常见策略。

硅步

1,022

章磊

2023-08-15

23067

迄今为止最完整的DDD实践

对于一个架构师来说，在软件开发中如何降低系统复杂度是一个永恒的挑战。

章磊

23,067

穿杨

2024-08-21

523

谈谈优雅的钩子--bpftrace

bpftrace是一个内核跟踪工具，简单来说就是在函数上挂个钩子，挂上钩子后就可以将函数的入参和返回值取出来再放入程序进行二次编程，最终能让程序按照我们的意图来对函数进行观测。

穿杨

523

硅步

2024-08-23

521

灵魂拷问-前端的作用--chrome插件篇

本文会从浏览器插件应用场景切入，穿插插件基础能力和常见入口的介绍，核心回答如下三个问题：插件可以被使用在哪些场景？不同的使用场景我们的主要代码实现思路是怎样的？我们可以从哪些角度入手自己开发一款可以落地实用的浏览器插件？

硅步

521

烨陌

2024-09-05

476

软件测试之道 -- 做一个有匠心的程序员

作者一年前围绕设计模式与代码重构写了一篇《代码整洁之道 -- 告别码农，做一个有思想的程序员！》的文章。本文作为续篇，从测试角度谈程序员对软件质量的追求。

烨陌

476

阿里云云原生

2025-05-06

1495

MCP 规范新版本特性全景解析与落地实践

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释

阿里云云原生

1,495

张佐玮

2023-12-01

1659

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,659

官方博客-第3页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

灵魂拷问-前端的作用--性能优化篇

迄今为止最完整的DDD实践

谈谈优雅的钩子--bpftrace

灵魂拷问-前端的作用--chrome插件篇

软件测试之道 -- 做一个有匠心的程序员

MCP 规范新版本特性全景解析与落地实践

Koordinator 助力云原生应用性能提升，小红书混部技术实践

官方博客-第3页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

灵魂拷问-前端的作用--性能优化篇

迄今为止最完整的DDD实践

谈谈优雅的钩子--bpftrace

灵魂拷问-前端的作用--chrome插件篇

软件测试之道 -- 做一个有匠心的程序员

MCP 规范新版本特性全景解析与落地实践

Koordinator 助力云原生应用性能提升，小红书混部技术实践