ModelScope

2024-05-15

1924

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

1,924

ModelScope

2024-05-15

711

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

711

德灵

2024-05-15

114852

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

114,852

致问

2023-09-15

119315

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

119,315

子白

2024-05-15

100860

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,860

昕羽

2024-05-15

65110

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

昕羽

65,110

ModelScope

2024-05-15

670

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

670

涯海

2024-05-15

144

链路追踪（Tracing）其实很简单——链路功能进阶指南

经过前面两章的学习，小玉已经熟练掌握分布式链路追踪的基础用法，比如回溯链路请求轨迹，定位耗时瓶颈点；配置核心接口黄金三指标告警，第一时间发现流量异常；大促前梳理应用上下游关键依赖，联系相关方协同备战等等。随...

涯海

144

杳天

2022-12-13

1748

技术原理，Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

杳天

1,748

类目筛选

内容类型

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

阿里云PAI大模型RAG对话系统最佳实践

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

链路追踪（Tracing）其实很简单——链路功能进阶指南

技术原理，Hologres Binlog技术原理揭秘