官方博客-第18页-阿里云开发者社区

望宸

2025-02-20

664

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

664

阿里云云原生

2025-02-25

1133

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,133

闵子

2023-12-01

2888

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,888

德灵

2024-05-15

118067

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,067

ModelScope

2024-05-15

110016

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,016

隆基

2024-05-15

108479

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构，最后再分别从业务场景切入，详细介绍 RocketMQ 5.0 在不同的业务场景提供的能力和关键技术原理，包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

隆基

108,479

阿里云大数据Al技术

2024-05-15

78239

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,239

ModelScope

2024-05-15

104704

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,704

太业

2024-05-15

1374

【最佳实践】使用CloudLens排查iLogtail重启问题

本文主要介绍如何使用CloudLens for SLS定位和解决iLogtail日常使用中的常见问题之一：iLogtail异常重启问题。

太业

1,374

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

解锁 DeepSeek 安全接入、稳定运行新路径

从浏览器原理出发聊聊Chrome插件

阿里云PAI大模型RAG对话系统最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

【AAAI 2024】MuLTI：高效视频与语言理解

手把手教你捏一个自己的Agent

【最佳实践】使用CloudLens排查iLogtail重启问题

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

解锁 DeepSeek 安全接入、稳定运行新路径

从浏览器原理出发聊聊Chrome插件

阿里云PAI大模型RAG对话系统最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

【AAAI 2024】MuLTI：高效视频与语言理解

手把手教你捏一个自己的Agent

【最佳实践】使用CloudLens排查iLogtail重启问题