ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

369

轮子

2024-05-15

144

基于图数据库搭建企业级的推荐类系统

本文为您介绍基于专有云敏捷版数据库场景DBStack和图数据库搭建企业级推荐类系统。

轮子

144

阿里云PolarDB

2023-09-11

892

典型场景 | PolarDB-X 如何支撑SaaS多租户

很多平台类应用或系统（如电商CRM平台、仓库订单平台等等），它们的服务模型是围绕用户维度（这里的用户维度可以是一个卖家或品牌，可以是一个仓库，等等）展开的。因此，这类型的平台业务，为了支持业务系统的水平扩展性，业务的数据库通常是按用户维度进行水平切分。

阿里云PolarDB

892

ModelScope

2024-05-15

326

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

326

瑞丹

2024-06-05

499

台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆

台州银行数据治理项目携手瓴羊Dataphin，荣获中国信息通信研究院评为“2023年铸基计划高质量数字化转型典型优秀案例”、数字化研究机构沙丘社区选为“2024中国数据资产管理最佳实践案例”双重认可。

瑞丹

499

阿里云瑶池数据库

2024-06-12

60238

突破大表瓶颈｜小鹏汽车使用PolarDB实现百亿级表高频更新和实时分析

PolarDB已经成为小鹏汽车应对TB级别大表标注、分析查询的"利器"。

阿里云瑶池数据库

60,238

阿里云瑶池数据库

2024-06-18

259

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性，解决了云数据仓库的性能瓶颈，同时支持了资源按需预留。Flux优于传统的方法，查询响应时间 (RT) 最多可减少75%，资源利用率提高19.0%，成本开销降低77.8%。

阿里云瑶池数据库

259

阿里云瑶池数据库

2024-07-18

72

Redis Proxy RT上升后连接倾斜

本文细致地描述了关于Redis Proxy RT上升后连接倾斜问题的排查过程和根本原因，最后给出了优化方案。

阿里云瑶池数据库

72

阿里云实时计算Flink

2023-03-30

4475

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,475

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

基于图数据库搭建企业级的推荐类系统

典型场景 | PolarDB-X 如何支撑SaaS多租户

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆

突破大表瓶颈｜小鹏汽车使用PolarDB实现百亿级表高频更新和实时分析

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

Redis Proxy RT上升后连接倾斜

Apache Paimon 在同程旅行的探索实践