2024-05-15
104802

深度|庖丁解InnoDB之Buffer Pool

聚焦在Buffer Pool的本职功能上,从其提供的接口、内存组织方式、Page获取、刷脏等方面进行介绍

104,802
2024-05-15
407

vLLM部署Yuan2.0:高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

2024-08-16
513

用 Higress AI 网关降低 AI 调用成本 - 阿里云天池云原生编程挑战赛参赛攻略

《Higress AI 网关挑战赛》正在火热进行中,Higress 社区邀请了目前位于排行榜 top5 的选手杨贝宁同学分享他的心得。本文是他整理的参赛攻略。

2023-08-25
368

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

2023-09-11
912

典型场景 | PolarDB-X 如何支撑SaaS多租户

很多平台类应用或系统(如电商CRM平台、仓库订单平台等等),它们的服务模型是围绕用户维度(这里的用户维度可以是一个卖家或品牌,可以是一个仓库,等等)展开的。因此,这类型的平台业务,为了支持业务系统的水平扩展性,业务的数据库通常是按用户维度进行水平切分。

2023-09-22
1461

沉浸式学习PostgreSQL|PolarDB 17: 向量数据库, 通义大模型AI的外脑

本文所涉及的实验体验的就是怎么建设AI的外脑?向量数据库的核心价值:AI外脑

1,461
2023-10-09
29855

基于阿里云服务网格流量泳道的全链路流量管理(一)严格模式流量泳道

灰度发布是一种常见的对新版本应用服务的发布手段,其特点在于能够将流量在服务的稳定版本和灰度版本之间时刻切换,以帮助我们用更加可靠的方式实现服务的升级。

29,855
2024-05-15
772

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI,创作你的专属冬日主题AI画作!

772
1
...
16
17
18
...
36
到第
17/36