子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,036

ModelScope

2024-05-15

654

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

654

ModelScope

2024-05-15

738

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

738

元丹

2024-05-15

280306

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

280,306

澄潭望宸

2024-07-22

275

AI 时代，网关更能打了

随着互联网从 Web 2.0 迈进到 AI 时代，用户和互联网的交互方式，AI 时代下互联网的内容生产流程都发生了显著的转变，这对基础设施（Infra）提出了新的诉求，也带来了新的机遇。Infra 包含的内容非常丰富，本文仅从网关层面分享笔者的所见所感所悟。

澄潭望宸

275

阿里云云原生

2024-07-29

114

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

114

君亮

2024-05-15

156

某运营商核心对客系统迁移PolarDB实践

数据库迁云是一个复杂工程，对于传统企业来说，数据库不仅沉淀业务数据，还沉淀了大量业务逻辑，数据迁移过程复杂，风险高。本文借用客户核心系统数据库迁移到PolarDB为例，介绍数据库迁移过程中遇到的挑战、对应的解决方案，供大家参考。

君亮

156

涯海

2024-05-15

214

链路追踪（Tracing）其实很简单——链路功能进阶指南

经过前面两章的学习，小玉已经熟练掌握分布式链路追踪的基础用法，比如回溯链路请求轨迹，定位耗时瓶颈点；配置核心接口黄金三指标告警，第一时间发现流量异常；大促前梳理应用上下游关键依赖，联系相关方协同备战等等。随...

涯海

214

启淮凡问

2024-07-16

11700

从一个服务预热不生效问题谈微服务无损上线

本文基于阿里云技术服务团队和产研团队，在解决易易互联使用 MSE（微服务引擎）产品无损上线功能所遇到问题的过程总结而成。本文将从问题和解决方法谈起，再介绍相关原理，后进一步拓展到对微服务引擎和云原生网关无损上线能力的介绍。

启淮凡问

11,700

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第7期：智能体的高效协作

快来与 CodeQwen1.5 结对编程

深入浅出LangChain与智能Agent：构建下一代AI助手

AI 时代，网关更能打了

从供应商深度绑定，到走向真正的云原生，他们是这样做的

某运营商核心对客系统迁移PolarDB实践

链路追踪（Tracing）其实很简单——链路功能进阶指南

从一个服务预热不生效问题谈微服务无损上线