孟威

2024-05-15

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,176

斜阳

2024-05-15

132448

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,448

休祯

2024-07-18

7523

流量回放新形态：基于网关 Access Log 发起

流量回放技术在性能测试和故障排除中至关重要。传统工具如 GoReplay、Tcpreplay 等存在高权限、配置复杂、登录态失效等痛点。PTS 推出基于 Access Log 的流量回放功能，自动生成压测场景，解决传统工具痛点，操作简单，一起来了解下吧~

休祯

7,523

扬流

2024-05-15

118012

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

118,012

栾枝

2023-07-18

130466

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

130,466

致问

2023-09-15

119392

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

119,392

元泊

2024-05-15

116982

日志服务 HarmonyOS NEXT 日志采集最佳实践

鸿蒙操作系统（HarmonyOS）上的日志服务（SLS）SDK 提供了针对 IoT、移动端到服务端的全场景日志采集、处理和分析能力，旨在满足万物互联时代下应用的多元化设备接入、高效协同和安全可靠运行的需求。

元泊

116,982

豁朗

2022-05-16

1796

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

1,796

ModelScope

2024-05-15

360

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

360

类目筛选

内容类型

SLS 大模型可观测&安全推理审计标准解决方案

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

流量回放新形态：基于网关 Access Log 发起

Paimon 与 Spark 的集成（二）：查询优化

手把手教你使用OSS-HDFS服务平替自建HDFS

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

日志服务 HarmonyOS NEXT 日志采集最佳实践

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

vLLM部署Yuan2.0：高吞吐、更便捷