ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

367

涯海

2024-06-03

61043

一站式链路追踪：阿里云的端到端解决方案

端到端链路追踪是覆盖全部关联 IT 系统，能够完整记录用户行为在系统间调用路径与状态的最佳实践方案。而真正实现端到端链路追踪，需要解决三个难题：链路插桩、链路采集与加工、链路上下文透传。阿里云 ARMS 目前已支持全链路端到端追踪，快来查看转发吧~

涯海

61,043

王奇

2023-06-26

8568

Hologres弹性计算在OLAP分析上的实践和探索

本文介绍了OLAP分析在大数据分析中的位置，分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题，解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践，介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。

王奇

8,568

里戈

2023-10-26

158089

如何充分发挥 SQL 能力？

如何充分发挥 SQL 能力，是本篇文章的主题。本文尝试独辟蹊径，强调通过灵活的、发散性的数据处理思维，就可以用最基础的语法，解决复杂的数据场景。

里戈

158,089

非有

2024-05-15

914

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

914

元乙

2024-05-15

53006

面向全栈可观测的性能监控

SLS性能持续分析基于开放的接入生态与持续性能分析的理念所构建（开放接入部分已在iLogtail开源），基于SLS 性能持续分析，将为广大开发者提供开箱即用、一站式的的性能观测体验，助力开发者轻松面对多云、多Region、多版本、微服务等场景下的性能分析需求。

元乙

53,006

ModelScope

2024-05-15

324

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

324

资源编排ROS

2024-07-09

172

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

WordPress 是流行的开源CMS，阿里云的ROS（Resource Orchestration Service）提供模板化部署服务，简化云上环境如VPC、ECS、MySQL的创建。用户可通过ROS控制台选择模板一键部署WordPress，配置包括实例区、类型、系统盘及密码等参数。ROS模板定义了资源、参数和输出，自动处理依赖关系，实现云资源和应用的自动化部署。通过ROS，用户可以高效管理和更新整个资源栈，实现快速、可靠的云服务部署。

资源编排ROS

172

偏左

2023-08-28

20789

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

20,789

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

一站式链路追踪：阿里云的端到端解决方案

Hologres弹性计算在OLAP分析上的实践和探索

如何充分发挥 SQL 能力？

一文详解 Java 限流接口实现

面向全栈可观测的性能监控

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

探索AI时代的应用工程化架构演进，一人公司时代还有多远？