ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

探索云世界

2024-05-15

126

函数计算 HTTP 触发器支持异步，解放双手搭建 Web 服务

当前阿里云函数计算支持两种类型的函数：事件函数和 HTTP 函数。其中 HTTP 函数结合 HTTP 触发器，能够支持用户直接通过 HTTP 请求利用 Restful API 的方式发起函数调用；通过这种方式，用户无需集成函数计算提供的 SDK 就能实现函数调用，更好地同已有系统的组件及 Web 服...

探索云世界

126

阿里云云原生

2024-05-15

78775

让研发规范管得住，在流水线之上做研发流程

研发规范的目标，是为了解决或降低出现软件危机的风险。但传统流水线受限于工具的定位，无法解决研发规范的落地问题，需要在更高的层面来解决。阿里云云效团队经过内部启发后推出的新产品：云效应用交付平台 AppStack 给出了解决方案，快来使用体验吧！

阿里云云原生

78,775

陈浩章颖强

2024-05-29

55226

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,226

阿里云大数据Al技术

2024-07-31

7057

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,057

易霏夏花

2024-08-16

7334

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

PolarDB-X 分布式数据库，采用集中式和分布式一体化的架构，为了能够灵活应对混合负载业务，作为数据存储的 Data Node 节点采用了多种数据结构，其中使用行存的结构来提供在线事务处理能力，作为 100% 兼容 MySQL 生态的数据库，DN 在 InnoDB 的存储结构基础上，进行了深度优化，大幅提高了数据访问的效率。

易霏夏花

7,334

资源编排ROS

2019-12-24

1904

资源编排ROS之自定制资源（基础篇）

本文介绍资源编排ROS的基础知识配置。

资源编排ROS

1,904

安正

2023-08-31

1120

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

在多维度的优化加持下，Alibaba Cloud Linux 3 解决了 AI 开发人员的痛点问题，让 AI 开发体验更容易更高效。

安正

1,120

寒亭

2024-05-15

513

一次访问Redis延时高问题排查与总结

作者抽丝剥茧的记录了一次访问Redis延时高问题的排查和总结。

寒亭

513

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

函数计算 HTTP 触发器支持异步，解放双手搭建 Web 服务

让研发规范管得住，在流水线之上做研发流程

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

OSS数据源一站式RAG最佳实践

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

资源编排ROS之自定制资源（基础篇）

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

一次访问Redis延时高问题排查与总结