ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

363

阿里云云原生

2024-05-16

56180

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

56,180

扬流

2024-05-15

118014

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

118,014

ModelScope

2024-05-15

394

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

394

阿里云云原生

2024-05-15

66746

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

阿里云云原生

66,746

资源编排ROS

2024-07-09

171

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

WordPress 是流行的开源CMS，阿里云的ROS（Resource Orchestration Service）提供模板化部署服务，简化云上环境如VPC、ECS、MySQL的创建。用户可通过ROS控制台选择模板一键部署WordPress，配置包括实例区、类型、系统盘及密码等参数。ROS模板定义了资源、参数和输出，自动处理依赖关系，实现云资源和应用的自动化部署。通过ROS，用户可以高效管理和更新整个资源栈，实现快速、可靠的云服务部署。

资源编排ROS

171

涯客十眠

2023-08-04

774

Sentinel 2.0 微服务零信任的探索与实践

涯客十眠

774

周宇睿

2023-09-08

470

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

470

元乙

2023-11-06

127730

从存储统一到数据融合，SLS在可观测场景的思考和行动

介绍SLS在可观测数据融合分析的一系列技术升级，融合Trace、全栈监控、Continuous Profiling、移动端监控等功能，帮助大家更快速地构筑全栈、自动化的观测能力。

元乙

127,730

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

Paimon 与 Spark 的集成（二）：查询优化

元象大模型开源30款量化版本加速低成本部署丨附教程

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

Sentinel 2.0 微服务零信任的探索与实践

MaxCompute半结构化数据思考与创新

从存储统一到数据融合，SLS在可观测场景的思考和行动

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

Paimon 与 Spark 的集成（二）：查询优化

元象大模型开源30款量化版本 加速低成本部署丨附教程

无需重新学习，使用 Kibana 查询/可视化 SLS 数据

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

Sentinel 2.0 微服务零信任的探索与实践

MaxCompute半结构化数据思考与创新

从存储统一到数据融合，SLS在可观测场景的思考和行动

元象大模型开源30款量化版本加速低成本部署丨附教程