官方博客-第29页-阿里云开发者社区

斜阳

2024-05-15

133375

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,375

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

ModelScope

2024-05-15

1107

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,107

阿里云瑶池数据库

2024-08-13

748

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

748

赵世振

2024-08-21

1443

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,443

布谷

2024-09-03

576

React 的正确使用方法：ref 篇

你真的用对了 useRef 吗？在与 TypeScript 一起使用、以及撰写组件库的情况下，你的写法能够避开以下所有场景的坑吗？

布谷

576

缘祺

2024-10-21

852

本文基于MySQL 8.0.34版本的源代码，详细介绍了MySQL中统计信息的计算和更新机制。文章首先概述了`records_per_key`统计信息在代价估计和Join Reorder算法中的重要性，接着了InnoDB统计信息的存储和计算方法，包括表级和索引级的统计信息。文章还介绍了统计信息的采样算法，特别是重要性采样在减少估计方差中的应用。此外，文章讨论了统计信息的更新时机，包括手动更新和自动更新。最后，文章简要介绍了直方图和其它统计信息，如表在内存中的占比估计，并通过实例展示了如何使用optimizer trace来分析查询优化过程。希望本文能帮助读者更好地理解MySQL的优化器。

缘祺

852

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

612

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

612

澄潭计缘望宸

2025-03-14

957

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

957

官方博客-第29页-阿里云开发者社区

类目筛选

内容类型

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

React 的正确使用方法：ref 篇

浅析MySQL优化器统计信息

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

官方博客-第29页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

React 的正确使用方法：ref 篇

浅析MySQL优化器统计信息

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要