王骜

2024-05-15

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,920

栾枝

2023-07-18

130485

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

130,485

ModelScope

2024-05-15

405

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

405

阿里云云原生

2024-06-13

55535

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具，本实验将带你体验云效应用交付平台 AppStack，从应用视角，完成一个 AI 聊天应用的高效交付。

阿里云云原生

55,535

喻奎

2023-06-25

10077

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,077

韩述

2023-09-13

2038

AnalyticDB PostgreSQL构建一站式实时数仓实践

本文介绍通过 AnalyticDB PostgreSQL 版基于实时物化视图，构建流批一体的一站式实时数仓解决方案，实现一套系统、一份数据、一次写入，即可在数仓内完成实时数据源头导入到实时分析全流程。

韩述

2,038

刘佳旭

2023-09-26

138065

云原生场景下高可用架构的最佳实践

刘佳旭

138,065

佳二

2024-05-15

104

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

本篇为系列第2篇，分享在支付宝支付数据链路改造升级过程中，针对数据倾斜的优化实践新方法，在解决数据倾斜问题的同时，还能兼顾更优的计算性能！

佳二

104

ModelScope

2024-05-15

375

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

375

类目筛选

内容类型

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

手把手教你使用OSS-HDFS服务平替自建HDFS

元象大模型开源30款量化版本加速低成本部署丨附教程

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

MaxCompute湖仓一体近实时增量处理技术架构揭秘

AnalyticDB PostgreSQL构建一站式实时数仓实践

云原生场景下高可用架构的最佳实践

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

vLLM部署Yuan2.0：高吞吐、更便捷

类目筛选

内容类型

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

手把手教你使用OSS-HDFS服务平替自建HDFS

元象大模型开源30款量化版本 加速低成本部署丨附教程

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

MaxCompute湖仓一体近实时增量处理技术架构揭秘

AnalyticDB PostgreSQL构建一站式实时数仓实践

云原生场景下高可用架构的最佳实践

奇思妙想的SQL｜兼顾性能的数据倾斜处理新姿势

vLLM部署Yuan2.0：高吞吐、更便捷

元象大模型开源30款量化版本加速低成本部署丨附教程