官方博客-第48页-阿里云开发者社区

ModelScope

2024-05-15

1120

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,120

阿里云云原生

2024-05-15

44083

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

44,083

资源编排ROS

2024-06-06

438

一键云部署：资源编排 ROS 轻松部署 LLM 流程编排服务 Flowise

Flowise 是一个开源低代码平台，用于构建定制化的 LLM 流程和 AI 代理。阿里云的 Resource Orchestration Service (ROS) 提供了一键部署 Flowise 到 ECS 实例的方案。用户只需在 ROS 控制台配置模板参数，如可用区和实例类型，即可完成部署。部署后，从资源栈输出获取 Flowise 服务地址以开始使用。ROS 模板定义了 VPC、ECS 实例等资源，并通过 ROS 自动化部署，简化了云上资源和应用的管理。

资源编排ROS

438

阿里云云原生

2024-06-13

56100

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具，本实验将带你体验云效应用交付平台 AppStack，从应用视角，完成一个 AI 聊天应用的高效交付。

阿里云云原生

56,100

硅步

2024-08-23

416

灵魂拷问-前端的作用--chrome插件篇

本文会从浏览器插件应用场景切入，穿插插件基础能力和常见入口的介绍，核心回答如下三个问题：插件可以被使用在哪些场景？不同的使用场景我们的主要代码实现思路是怎样的？我们可以从哪些角度入手自己开发一款可以落地实用的浏览器插件？

硅步

416

阿里云云原生

2024-09-02

458

基于 RocketMQ 的云原生 MQTT 消息引擎设计

本文将介绍阿里云如何将 Serverless 架构应用于消息队列，有效降低运营成本，同时利用云原生环境的特性，为 IoT 设备提供快速响应和灵活伸缩的通讯能力。

阿里云云原生

458

库恩

2024-09-03

282

开局一张图，debug全靠瞪｜内核问题定位与静态分析实战

本文描述了一个在AnolisOS 8.8操作系统上遇到的内核崩溃问题的调试过程。

库恩

282

布谷

2024-09-03

569

React 的正确使用方法：ref 篇

你真的用对了 useRef 吗？在与 TypeScript 一起使用、以及撰写组件库的情况下，你的写法能够避开以下所有场景的坑吗？

布谷

569

执少

2024-09-06

289

高基数 GroupBy 在 SLS SQL 中的查询加速

本文详细介绍了SLS中的高基数GroupBy查询加速技术。

执少

289

官方博客-第48页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

一键云部署：资源编排 ROS 轻松部署 LLM 流程编排服务 Flowise

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

灵魂拷问-前端的作用--chrome插件篇

基于 RocketMQ 的云原生 MQTT 消息引擎设计

开局一张图，debug全靠瞪｜内核问题定位与静态分析实战

React 的正确使用方法：ref 篇

高基数 GroupBy 在 SLS SQL 中的查询加速

官方博客-第48页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

一键云部署：资源编排 ROS 轻松部署 LLM 流程编排服务 Flowise

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

灵魂拷问-前端的作用--chrome插件篇

基于 RocketMQ 的云原生 MQTT 消息引擎设计

开局一张图，debug全靠瞪｜内核问题定位与静态分析实战

React 的正确使用方法：ref 篇

高基数 GroupBy 在 SLS SQL 中的查询加速