岱泽

2024-05-15

总结｜性能优化思路及常用工具及手段

性能优化是降低成本的手段之一，每年大促前业务平台都会组织核心链路上的应用做性能优化，一方面提升系统性能，另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验，探讨一下性能优化的思路及常用工具及手段。

岱泽

75,577

子白

2024-05-15

101270

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,270

千习

2024-07-22

14609

Spring Cloud Alibaba 集成分布式定时任务调度功能

Spring Cloud Alibaba 发布了 Scheduling 任务调度模块 [#3732]提供了一套开源、轻量级、高可用的定时任务解决方案，帮助您快速开发微服务体系下的分布式定时任务。

千习

14,609

阿里云实时数仓Hologres

2024-06-07

128872

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

128,872

赵世振

2024-07-30

493

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

493

翊云

2024-08-15

310

MySQL实现并发控制的过程

数据库系统到底是怎么进行并发访问控制的？本文以 MySQL 8.0.35 代码为例，尝试对 MySQL 中的并发访问控制进行整体介绍。

翊云

310

赵世振

2024-08-21

246

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用“百炼”平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用“百炼”的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

246

计缘

2024-09-02

128

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

本文带大家了解一下如何使用阿里云Serverless计算产品函数计算构建生产级别的LLM Chat应用。该最佳实践会指导大家基于开源WebChat组件LobeChat和阿里云函数计算（FC）构建企业生产级别LLM Chat应用。实现同一个WebChat中既可以支持自定义的Agent，也支持基于Ollama部署的开源模型场景。

计缘

128

ModelScope

2024-05-15

2158

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

2,158

类目筛选

内容类型

总结｜性能优化思路及常用工具及手段

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Spring Cloud Alibaba 集成分布式定时任务调度功能

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云百炼应用实践系列-AI助手快速搭建

MySQL实现并发控制的过程

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦