ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

373

王奇

2023-06-26

8571

Hologres弹性计算在OLAP分析上的实践和探索

本文介绍了OLAP分析在大数据分析中的位置，分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题，解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践，介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。

王奇

8,571

杨永

2024-05-15

652

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

652

升正

2024-05-15

67

请删掉99%的useMemo

你的useMemo真正为你的项目带来了多少性能上的优化？由于useMemo和useCallback类似，所以本文全文会在大部分地方以useMemo为例，部分例子使用useCallback帮助大家更好的理解两个hooks。

升正

67

涯海

2024-06-03

61045

一站式链路追踪：阿里云的端到端解决方案

端到端链路追踪是覆盖全部关联 IT 系统，能够完整记录用户行为在系统间调用路径与状态的最佳实践方案。而真正实现端到端链路追踪，需要解决三个难题：链路插桩、链路采集与加工、链路上下文透传。阿里云 ARMS 目前已支持全链路端到端追踪，快来查看转发吧~

涯海

61,045

刘军

2024-06-18

16553

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

本文展示了 Dubbo3 triple 协议是如何简化从协议规范与实现上简化开发测试、入口流量接入成本的，同时提供高性能通信、面向接口的易用性编码。

刘军

16,553

非有

2024-05-15

919

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

919

岱泽

2024-05-15

75511

总结｜性能优化思路及常用工具及手段

性能优化是降低成本的手段之一，每年大促前业务平台都会组织核心链路上的应用做性能优化，一方面提升系统性能，另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验，探讨一下性能优化的思路及常用工具及手段。

岱泽

75,511

ModelScope

2024-05-15

218

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

218

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

Hologres弹性计算在OLAP分析上的实践和探索

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

请删掉99%的useMemo

一站式链路追踪：阿里云的端到端解决方案

Dubbo3 服务原生支持 http 访问，兼具高性能与易用性

一文详解 Java 限流接口实现

总结｜性能优化思路及常用工具及手段

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术