官方博客-第16页-阿里云开发者社区

子白

2024-05-15

102443

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,443

德灵

2024-05-15

118057

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,057

竹兴

2024-05-15

130479

MySQL支持了很多Charset与Collation，并且允许用户在连接、Server、库、表、列、字面量多个层次上进行精细化配置，这有时会让用户眼花缭乱。本文对相关概念、语法、系统变量、影响范围都进行了详细介绍，并且列举了有可能让字符串发生字符集转换的情况，以及来自不同字符集的字符串进行比较等操作时遵循的规则。对于最常用的基于Unicode的字符集，本文介绍了Unicode标准与MySQL中各个字符集的关系，尤其详细介绍了当前版本(8.0.34)默认字符集utf8mb4。

竹兴

130,479

ModelScope

2024-05-15

1201

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,201

ModelScope

2024-05-15

2584

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,584

ModelScope

2024-05-15

1851

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,851

李德

2024-12-06

1337

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,337

勉成

2024-12-20

1564

Redis是如何建立连接和处理命令的

本文主要讲述 Redis 是如何监听客户端发出的set、get等命令的。

勉成

1,564

阿里云开发者

2025-03-21

801

在IDEA中借助满血版 DeepSeek 提高编码效率

通义灵码2.0引入了DeepSeek V3与R1模型，新增Qwen2.5-Max和QWQ模型，支持个性化服务切换。阿里云发布开源推理模型QwQ-32B，在数学、代码及通用能力上表现卓越，性能媲美DeepSeek-R1，且部署成本低。AI程序员功能涵盖表结构设计、前后端代码生成、单元测试与错误排查，大幅提升开发效率。跨语言编程示例中，成功集成DeepSeek-R1生成公告内容。相比1.0版本，2.0支持多款模型，丰富上下文类型，具备多文件修改能力。总结显示，AI程序员生成代码准确度高，但需参考现有工程风格以确保一致性，错误排查功能强大，适合明确问题描述场景。相关链接提供下载与原文参考。

阿里云开发者

801

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

详解MySQL字符集和Collation

元象大模型开源30款量化版本加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Multi-Agent实践第7期：智能体的高效协作

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

Redis是如何建立连接和处理命令的

在IDEA中借助满血版 DeepSeek 提高编码效率

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

详解MySQL字符集和Collation

元象大模型开源30款量化版本 加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Multi-Agent实践第7期：智能体的高效协作

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

Redis是如何建立连接和处理命令的

在IDEA中借助满血版 DeepSeek 提高编码效率

元象大模型开源30款量化版本加速低成本部署丨附教程