官方博客-第16页-阿里云开发者社区

子白

2024-05-15

102414

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,414

ModelScope

2024-05-15

3505

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,505

ModelScope

2024-05-15

104668

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,668

张昕东

2024-07-25

14019

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,019

牛俊

2024-08-15

11729

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,729

阿里云存储

2024-10-08

1360

Data+AI双轮驱动，阿里云存储服务全面升级

近日，2024云栖大会现场，阿里云宣布对其存储服务进行全面升级，围绕 Storage for AI 与 AI in Storage 两大领域，提出“4 Any + 3 AI ”的升级方向，揭示存储基础设施与AI的双向赋能路径。阿里云存储产品将支持更多AI业务高效创新，同时 AI 技术也将助力基础设施迭代，支持企业更好地管理数据资产。

阿里云存储

1,360

虎仔

2024-10-22

1136

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,136

右予故黎

2024-11-21

968

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

968

阿里云云原生

2024-11-26

605

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

在 Apache Dubbo 3.3.0 版本之后，官方推出了全新升级的 Triple X 协议，全面支持 HTTP/1、HTTP/2 和 HTTP/3 协议。本文将围绕 Triple 协议对 HTTP/3 的支持进行详细阐述，包括其设计目标、实际应用案例、性能测试结果以及源码架构分析等内容。

阿里云云原生

605

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

手把手教你捏一个自己的Agent

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

动手实践：高效构建企业级AI搜索

Data+AI双轮驱动，阿里云存储服务全面升级

最佳实践：通义灵码生成单元测试，让单测更简单

“无”中生有：基于知识增强的RAG优化实践

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

手把手教你捏一个自己的Agent

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

动手实践：高效构建企业级AI搜索

Data+AI双轮驱动，阿里云存储服务全面升级

最佳实践：通义灵码生成单元测试，让单测更简单

“无”中生有：基于知识增强的RAG优化实践

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍