官方博客-第16页-阿里云开发者社区

子白

2024-05-15

102350

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,350

阿里云云原生

2024-05-15

63243

All in One：Prometheus 多实例数据统一管理最佳实践

当管理多个Prometheus实例时，阿里云Prometheus托管版相比社区版提供了更可靠的数据采集和便捷的管理。本文比较了全局聚合实例与数据投递方案，两者在不同场景下各有优劣。

阿里云云原生

63,243

阿里云云原生

2024-05-15

44031

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

44,031

ModelScope

2024-05-15

1068

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,068

阿里云云原生

2024-05-15

73670

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

73,670

阿里云大数据Al技术

2024-08-09

9041

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,041

阿里云云原生

2024-11-04

1290

就3步，用通义灵码写一个数字华容道小游戏

Hey，小伙伴！你是不是总是下定了学习编程的决心，但又因为枯燥、困难打起了退堂鼓？今天让我们跟着通义灵码边玩边练，只需要简单的几句话，就可以打造一款经典的数字华容道小游戏，即使没有代码基础也能快速上手，也许在这个过程中，你不经意间就掌握了一些编程知识。让我们开始吧！

阿里云云原生

1,290

新念

2025-02-14

1326

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,326

日休

2025-03-06

1273

一招解决数据库中报表查询慢的痛点

本文旨在解决传统数据库系统如PostgreSQL在处理复杂分析查询时面临的性能瓶颈问题。

日休

1,273

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

All in One：Prometheus 多实例数据统一管理最佳实践

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码技术解析，打造 AI 原生开发新范式

基于RAG搭建企业级知识库在线问答

就3步，用通义灵码写一个数字华容道小游戏

DeepSeek-V3 高效训练关键技术分析

一招解决数据库中报表查询慢的痛点

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

All in One：Prometheus 多实例数据统一管理最佳实践

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码技术解析，打造 AI 原生开发新范式

基于RAG搭建企业级知识库在线问答

就3步，用通义灵码写一个数字华容道小游戏

DeepSeek-V3 高效训练关键技术分析

一招解决数据库中报表查询慢的痛点