阿里云百炼

2024-07-09

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

本文以百炼官方文档问答助手为例，介绍如何基于百炼平台打造基于LlamaIndex的RAG文档问答产品。我们基于百炼平台的底座能力，以官方帮助文档为指定知识库，搭建了问答服务，支持钉钉、Web访问。介绍了相关技术方案和主要代码，供开发者参考。

阿里云百炼

470

子白

2024-05-15

101042

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,042

ModelScope

2024-05-15

2042

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

2,042

悟鸣

2024-05-15

238432

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

238,432

赵世振

2024-07-29

306

阿里云百炼产品月刊【2024年7月】

阿里云百炼产品月刊【2024年7月】，涵盖本月产品和功能发布、市场活动和应用实践等内容，帮助您快速了解阿里云百炼产品的最新动态。

赵世振

306

ModelScope

2024-05-15

658

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

658

郑嘉扬何杉

2024-05-15

58763

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

享道出行利用阿里云容器服务ACK，结合AHPA智能弹性与ECS、ECI混合部署，解决了业务潮汐效应带来的弹性滞后和成本问题。

郑嘉扬何杉

58,763

ModelScope

2024-05-15

742

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

742

ModelScope

2024-05-15

877

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

877

类目筛选

内容类型

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

一文掌握大模型提示词技巧：从战略到战术

阿里云百炼产品月刊【2024年7月】

Multi-Agent实践第7期：智能体的高效协作

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

快来与 CodeQwen1.5 结对编程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧