ModelScope

2024-05-15

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

729

子白

2024-05-15

101024

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,024

ModelScope

2024-05-15

2027

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

2,027

ModelScope

2024-05-15

646

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

646

李林杨

2024-05-15

442

智能客服对话系统解决方案

针对问题咨询场景中出现大量相关领域的问题，PAI提供了智能客服对话系统解决方案，以降低客户等待时间和人工客服成本。本文以汽车售前咨询业务领域为例，介绍如何基于人工智能算法，快速构建智能客服对话系统。

李林杨

442

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

41964

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

41,964

致问

2023-09-15

119386

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

119,386

杨永

2024-05-15

636

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

636

ModelScope

2024-05-15

359

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

359

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

Multi-Agent实践第7期：智能体的高效协作

智能客服对话系统解决方案

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

vLLM部署Yuan2.0：高吞吐、更便捷