子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,031

阿里云存储

2024-05-15

138727

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,727

孟威

2024-05-15

104175

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,175

太业

2024-05-15

410

【最佳实践】iLogtail使用Grok语法解析日志

目标读者数字化系统开发运维（DevOps）工程师、稳定性工程师（SRE）、可观测平台运维人员等。背景介绍日志的形式往往多种多样，如果只是简单的读入日志数据，将很难进行搜索、分析及可视化。将原始的日志数据解析为结构化的数据，将大幅提升数据的可用性，方便用户进行快捷的“字段-值”的查询和分析。最基础的解...

太业

410

阿里云云原生

2024-07-29

111

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

111

斜阳

2024-05-15

132446

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,446

云服务器ECS

2023-10-17

698

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

698

休祯

2024-07-18

7522

流量回放新形态：基于网关 Access Log 发起

流量回放技术在性能测试和故障排除中至关重要。传统工具如 GoReplay、Tcpreplay 等存在高权限、配置复杂、登录态失效等痛点。PTS 推出基于 Access Log 的流量回放功能，自动生成压测场景，解决传统工具痛点，操作简单，一起来了解下吧~

休祯

7,522

石樵

2023-12-01

1305

分布式锁实现原理与最佳实践

在单体的应用开发场景中涉及并发同步时，大家往往采用Synchronized（同步）或同一个JVM内Lock机制来解决多线程间的同步问题。而在分布式集群工作的开发场景中，就需要一种更加高级的锁机制来处理跨机器的进程之间的数据同步问题，这种跨机器的锁就是分布式锁。接下来本文将为大家分享分布式锁的最佳实践。

石樵

1,305

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

用软硬协同设计下的飞天盘古降低存储系统开销

SLS 大模型可观测&安全推理审计标准解决方案

【最佳实践】iLogtail使用Grok语法解析日志

从供应商深度绑定，到走向真正的云原生，他们是这样做的

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

使用ECS部署并使用Docker

流量回放新形态：基于网关 Access Log 发起

分布式锁实现原理与最佳实践