星舰正泽

2024-05-15

通义千问API：找出两篇文章的不同

本章我们将介绍如何利用大模型开发一个文档比对小工具，我们将用这个工具来给互联网上两篇内容相近但版本不同的文档找找茬，并且我们提供了一种批处理文档比对的方案

星舰正泽

8,327

阿里云实时数仓Hologres

2024-06-07

128669

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

128,669

阿里云实时数仓Hologres

2024-06-27

72171

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

阿里云实时数仓Hologres

72,171

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

42009

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

42,009

ModelScope

2024-05-15

820

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

820

隆基

2024-05-15

140726

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

140,726

米基

2024-05-15

776

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

776

子白

2024-05-15

101062

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,062

古琦

2024-07-04

108285

全链路追踪 & 性能监控，GO 应用可观测全面升级

当前，大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入，需要开放人员手动进行埋点，会存在一定问题。对此，可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案，能通过无侵入的方式实现应用监控能力。

古琦

108,285

类目筛选

内容类型

通义千问API：找出两篇文章的不同

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

Hologres+Flink企业级实时数仓核心能力介绍

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

大模型推理优化实践：KV cache复用与投机采样

大语言模型推理提速，TensorRT-LLM 高性能推理实践

全链路追踪 & 性能监控，GO 应用可观测全面升级