2024-05-15
377

vLLM部署Yuan2.0:高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

2023-07-18
130485

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

130,485
2024-05-15
271

SpringBoot项目部署上云

本文为第一期「实战派」有奖征文优秀作品,在ECS或轻量应用服务器上通过宝塔面板实现SpringBoot项目,并使用域名公网访问。

2024-05-15
213

全景剖析阿里云容器网络数据链路(五)—— Terway ENI-Trunking

本文是[全景剖析容器网络数据链路]第五部分部分,主要介绍Kubernetes Terway ENI-Trunking模式下,数据面链路的转转发链路。

213
2023-06-25
10077

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

10,077
2023-09-26
138065

云原生场景下高可用架构的最佳实践

云原生场景下高可用架构的最佳实践

138,065
2024-05-15
145

多云场景下主机安全防护

本文介绍如何使用阿里云的云安全中心去管理其他云厂商(腾讯云)主机。

145
2022-12-13
1850

技术原理,Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

1,850
2022-12-28
1215

阿里CCO基于Hologres的亿级明细BI探索分析实践

阿里CCO基于Hologres的亿级明细BI探索分析实践。

1,215
1
...
8
9
10
...
26
到第
9/26