王骜

2024-05-15

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,939

ModelScope

2024-05-15

428

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

428

ModelScope

2024-05-15

411

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

阿里云实时数仓Hologres

2024-05-15

74405

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

74,405

阿里云云原生

2024-05-15

61149

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍

可视化与YAML编排兼具，云效CI/CD流水线你愿意打几分？

阿里云云原生

61,149

澄潭董艺荃

2024-05-16

87961

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,961

太业

2024-06-03

41509

iLogtail 2.0 重大升级，端上支持 SPL

日志数据格式可能是多样且复杂的，iLogtail 插件配置模式已经可以很好的支持复杂数据的处理。iLogtail2.0 又带来了 SPL 语法的重大支持，在日志处理场景下，可以通过多级管道对数据进行交互式、递进式的探索和处理，从配置交互和性能上，都有比较大的提升和优化。iLogtail2.0 已经在逐步灰度中，欢迎大家体验和使用。

太业

41,509

阿里云云原生

2024-06-13

55557

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具，本实验将带你体验云效应用交付平台 AppStack，从应用视角，完成一个 AI 聊天应用的高效交付。

阿里云云原生

55,557

资源编排ROS

2019-12-24

1904

资源编排ROS之自定制资源（基础篇）

本文介绍资源编排ROS的基础知识配置。

资源编排ROS

1,904

类目筛选

内容类型

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

vLLM部署Yuan2.0：高吞吐、更便捷

大数据分析平台之 OLAP 架构的最佳实践

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

iLogtail 2.0 重大升级，端上支持 SPL

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

资源编排ROS之自定制资源（基础篇）