官方博客-第23页-阿里云开发者社区

ModelScope

2024-05-15

924

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

924

探索云世界

2024-05-15

109429

吴泳铭：拥抱人工智能驱动的产业智能革命

探索云世界

109,429

ModelScope

2024-05-15

1128

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,128

李鹏

2024-05-15

574

Serverless Kubernetes 开发实践：异构资源，按需使用

Kubernetes 作为当今云原生业界标准，具备良好的生态以及跨云厂商能力。Kubernetes 很好的抽象了 IaaS 资源交付标准，使得云资源交付变的越来越简单，与此同时用户期望更多的聚焦于业务自身，做到面向应用交付，Serverless 理念也因此而生。那么如何通过原生 k8s 提供Serverless 能力？如何实现GPU等异构资源按需使用？这里给大家介绍一下我们在Serverless Kubernetes 开发实践：异构资源，按需使用。

李鹏

574

阿里云实时数仓Hologres

2024-05-15

75041

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,041

资源编排ROS

2024-06-24

400

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

400

张昕东

2024-07-25

14023

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,023

阿里云云原生

2024-09-02

660

西游再现，一键部署 Flux 文生图大模型生成西游人物

从花果山的灵石出世，到取经路上的九九八十一难，再到大闹天宫的惊心动魄……这些耳熟能详的西游场景，如今都能通过 Flux 模型，以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型，搭配 Lora 模型，无需复杂的配置，一键部署，你就能成为这场视觉盛宴的创造者。

阿里云云原生

660

不达

2024-09-11

308

内核网络小白之故障寻踪记

本文记述了一次由 skb（socket buffer）异常导致的内核故障排查过程。

不达

308

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

吴泳铭：拥抱人工智能驱动的产业智能革命

vLLM部署Yuan2.0：高吞吐、更便捷

Serverless Kubernetes 开发实践：异构资源，按需使用

大数据分析平台之 OLAP 架构的最佳实践

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

西游再现，一键部署 Flux 文生图大模型生成西游人物

内核网络小白之故障寻踪记

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

吴泳铭：拥抱人工智能驱动的产业智能革命

vLLM部署Yuan2.0：高吞吐、更便捷

Serverless Kubernetes 开发实践：异构资源，按需使用

大数据分析平台之 OLAP 架构的最佳实践

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

西游再现，一键部署 Flux 文生图大模型生成西游人物

内核网络小白之故障寻踪记