官方博客-第19页-阿里云开发者社区

子白

2024-05-15

102409

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,409

ModelScope

2024-05-15

1819

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,819

阿里云云原生

2024-05-15

55685

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,685

骐迹

2024-05-15

1751

随着企业客户上云的深入，越来越多的客户会选择在阿里云全球region多地部署其企业业务系统，以便其全球化业务的迅速开展。阿里云在云上有非常丰富云网络产品，来协助企业客户在全球region迅速构建云上多个地域的互联互通，帮忙企业客户快速实现业务上线。本章节为您介绍如何使用云企业网转发路由器CEN-TR（Transit Router），来实现客户本地多个不同城市数据中心IDC（Internet Data Center）和云上VPC跨地域互通互联。

骐迹

1,751

豁朗

2024-05-15

897

用SLS配置日志关键字告警的N种方法

本文由日志关键词告警出发，介绍了使用SLS进行关键词监控告警配置，并且介绍了几种常见的配置方法，可以覆盖关键词监控的大部分场景。

豁朗

897

阿里云中间件

2024-07-23

15590

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

大语言模型的革命性突破使智能编程成为了可能，通义灵码正是基于通义大模型打造的 AI 编程助手，通过 IDE 插件的形式提供代码补全、单元测试生成等功能，能达到毫秒级的响应速度。目前，通义灵码已在阿里云内部及多家企业中应用，阿里云也在探索多智能体产品，即 AI 程序员，助力数字世界的蓬勃发展，颠覆 IT 生产力。

阿里云中间件

15,590

柳遵飞

2024-11-22

1304

Spring Cloud+Nacos+KMS 动态配置最佳实践

本文讲述了 Spring Cloud 应用中结合 Nacos 实现了运行期配置动态更新的功能，以及在此基础上结合 KMS 在不改动代码的情况下对应用使用的敏感配置进行保护，解决将配置迁移到 Nacos 中可能存在的数据安全顾虑，并对其底层工作原理做了简单介绍。

柳遵飞

1,304

李德

2024-12-06

1304

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,304

勉成

2024-12-12

559

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

559

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第7期：智能体的高效协作

Higress 全新 Wasm 运行时，性能大幅提升

阿里云全球跨地域网络互通方案

用SLS配置日志关键字告警的N种方法

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

Spring Cloud+Nacos+KMS 动态配置最佳实践

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

如何找出Java进程占用CPU高的元凶

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第7期：智能体的高效协作

Higress 全新 Wasm 运行时，性能大幅提升

阿里云全球跨地域网络互通方案

用SLS配置日志关键字告警的N种方法

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

Spring Cloud+Nacos+KMS 动态配置最佳实践

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

如何找出Java进程占用CPU高的元凶