官方博客-第14页-阿里云开发者社区

子白

2024-05-15

102418

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,418

吴昆

2024-05-15

222062

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,062

在峰

2024-06-24

56439

解锁分布式云多集群统一监控的云上最佳实践

为应对分布式云多集群监控的挑战，阿里云可观测监控 Prometheus 版结合 ACK One，凭借高效纳管与全局监控方案有效破解了用户在该场景的监控运维痛点，为日益增长的业务需求提供了一站式、高效、统一的监控解决方案，实现成本与运维效率的双重优化。助力企业的数字化转型与业务快速增长，在复杂多变的云原生时代中航行，提供了一个强有力的罗盘与风帆。

在峰

56,439

牛俊

2024-08-15

11737

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,737

阿里云云原生

2024-09-14

662

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云云原生 8 月产品月报。

阿里云云原生

662

李泽政

2024-11-01

792

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

792

龙蜥社区OpenAnolis

2024-11-06

721

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

721

右予故黎

2024-11-21

972

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

972

橙唯

2025-02-21

885

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

885

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

解锁分布式云多集群统一监控的云上最佳实践

动手实践：高效构建企业级AI搜索

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

“无”中生有：基于知识增强的RAG优化实践

基于LLM打造沉浸式3D世界

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Kube Queue：Kubernetes 任务排队的利器

解锁分布式云多集群统一监控的云上最佳实践

动手实践：高效构建企业级AI搜索

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

“无”中生有：基于知识增强的RAG优化实践

基于LLM打造沉浸式3D世界