2024-05-15
362

vLLM部署Yuan2.0:高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

2023-05-29
5374

AnalyticDB(ADB)+LLM,构建AIGC时代下企业专属Chatbot

如何基于向量数据库+LLM(大语言模型),打造更懂你的企业专属Chatbot。

2024-05-15
145467

弹性调度助力企业灵活应对业务变化,高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化,并高效管理云上资源。

145,467
2024-05-15
61430

走进RDS之MySQL内存分配与管理(中)

MySQL内存分配与管理总体上分为上中下三篇介绍,本篇为中篇,主要介绍 InnoDB 的内存构成和使用,代码版本主要基于8.0.25。

61,430
2022-05-16
1796

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式,只需要部署少量的Logtail容器,即可采集不同业务容器的日志。

1,796
2024-05-15
125409

弱结构化日志 Flink SQL 怎么写?SLS SPL 来帮忙

弱结构化日志 Flink SQL 怎么写?SLS SPL 来帮忙

125,409
2024-05-15
187

ADB PG最佳实践之高效复制数据到RDS PG

ADB PG是一个经典MPP数据库,长项在于查询分析处理,面对客户联机分析和联机交易(HTAP)场景就显得力不从心,我们在某银行核心系统DB2 for LUW迁移到ADB PG时就遇到类似问题,因此我们提出ADB PG+RDS PG混搭技术架构,来解决客户此类HTAP需求。该混搭架构的精髓在于扬长避短,充分发挥分析型数据库和交易型数据库的长处和特性,分析型数据库专注于数据加工跑批场景,然后批量加工的结果数据卸载到RDS PG,通过RDS PG对外提供高并发对客交易服务。

187
2024-05-15
142

泛娱乐直播平台的数据库选型和场景解决方案

直播平台的数据库选型要考虑流量波动、数据规模和实时性需求,如使用Redis的Sorted Set处理实时排行榜,List处理用户关注列表,使用分布式数据库PolarDB-X处理核心业务数据,AnalyticDB进行大数据分析。通过这些技术和策略,直播平台能够应对复杂的业务需求和流量挑战。

142
2024-05-15
309

全景剖析阿里云容器网络数据链路(六)—— ASM Istio

本文是[全景剖析容器网络数据链路]第六部分部分,主要介绍ASM Istio模式下,数据面链路的转转发链路。

309
1
...
7
8
9
...
27
到第
8/27