官方博客-第17页-阿里云开发者社区

子白

2024-05-15

102418

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,418

德灵

2024-05-15

118034

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,034

ModelScope

2024-05-15

1922

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,922

李林杨

2024-05-15

545

图像检索解决方案

针对图像检索业务场景，PAI提供了端到端的相似图像匹配和图像检索解决方案。本文介绍如何基于未标注的数据构建图像自监督模型，助力您快速搭建相似图像匹配和图像检索业务系统，进而实现以图搜图。

李林杨

545

古琦

2024-07-04

109470

全链路追踪 & 性能监控，GO 应用可观测全面升级

当前，大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入，需要开放人员手动进行埋点，会存在一定问题。对此，可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案，能通过无侵入的方式实现应用监控能力。

古琦

109,470

钰诚

2024-08-12

534

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

534

垚佳汐遥

2024-10-23

1008

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,008

逸陵

2024-11-18

981

在当今数字化转型加速的时代，企业 IT 系统的复杂度与日俱增，如何高效地管理和监控这些系统成为了一项挑战。阿里云作为全球领先的云计算服务商，提供了一整套全面的可观测性解决方案，覆盖从业务、端侧（小程序、APP、H5 等）、应用、中间件、容器/ECS 等全栈的监控体系，旨在帮助企业构建强大而灵活的可观测性体系。其中，标签（Tag）作为一种核心组织和管理手段，在阿里云可观测体系中扮演着至关重要的角色。本文将深入探讨阿里云可观测系列产品中标签的应用，以及如何运用标签在阿里云可观测产品体系下进行体系化建设并给出相关最佳实践。

逸陵

981

柳遵飞

2024-12-11

937

SpringCloud 应用 Nacos 配置中心注解

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

937

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

图像检索解决方案

全链路追踪 & 性能监控，GO 应用可观测全面升级

使用 Higress 快速构建 AI 应用

通义灵码知识库问答增强：知识库构建与管理指南

一文详解阿里云可观测体系下标签最佳实践

SpringCloud 应用 Nacos 配置中心注解

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

图像检索解决方案

全链路追踪 & 性能监控，GO 应用可观测全面升级

使用 Higress 快速构建 AI 应用

通义灵码知识库问答增强：知识库构建与管理指南

一文详解阿里云可观测体系下标签最佳实践

SpringCloud 应用 Nacos 配置中心注解