ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

407

阿里云存储

2024-06-26

25639

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

本文介绍了AutoMQ基于Regional ESSD构建的十倍降本云原生，降低成本并提供无限容量，通过将存储层分离，使用ESSD作为WAL，OSS作为主存储，实现了成本降低和性能优化。此外，它利用弹性伸缩和抢占式实例，减少了70%的计算成本，并通过秒级分区迁移实现了高效弹性。而且，AutoMQ与Apache Kafka相比，能实现10倍成本优化和百倍弹性效率提升，且完全兼容Kafka API。

阿里云存储

25,639

偏左

2023-08-28

20803

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

20,803

林以琳

2024-05-15

772

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

772

阿里云大数据Al技术

2024-05-15

77694

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,694

阿里云云原生

2024-05-15

108

实践总结｜前端架构设计的一点考究（上）

本文总结了作者在日常/大促业务的“敏捷”开发过程中产生的疑惑，并尝试做出思考得到一些解决思路和方案。在前端开发和实践过程中，梳理了一些简单设计方案可以缓解当时 “头疼” 的几个敏捷迭代问题，并实践在项目迭代中。

阿里云云原生

108

澄潭董艺荃

2024-05-16

87958

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

87,958

阿柄

2024-07-01

40346

5% 消耗，6 倍性能：揭秘新一代 iLogtail SPL 日志处理引擎与 Logstash 的 PK

在本文中，我们将深入探讨为何选择 iLogtail，以及它在 SPL 数据处理方面相较于 Logstash 有何独特优势。通过对比这两款工具的架构、性能以及功能，我们希望能够揭示 iLogtail 如何在日益复杂的日志处理需求中脱颖而出，帮助您做出明智的技术选择。

阿柄

40,346

资源编排ROS

2024-07-09

184

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

WordPress 是流行的开源CMS，阿里云的ROS（Resource Orchestration Service）提供模板化部署服务，简化云上环境如VPC、ECS、MySQL的创建。用户可通过ROS控制台选择模板一键部署WordPress，配置包括实例区、类型、系统盘及密码等参数。ROS模板定义了资源、参数和输出，自动处理依赖关系，实现云资源和应用的自动化部署。通过ROS，用户可以高效管理和更新整个资源栈，实现快速、可靠的云服务部署。

资源编排ROS

184

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

AutoMQ：基于 Regional ESSD 构建十倍降本的云原生 Kafka

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

基于PAI-DSW快速启动Stable Diffusion WebUI

【AAAI 2024】MuLTI：高效视频与语言理解

实践总结｜前端架构设计的一点考究（上）

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

5% 消耗，6 倍性能：揭秘新一代 iLogtail SPL 日志处理引擎与 Logstash 的 PK

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例