官方博客-第16页-阿里云开发者社区

裘展

2024-11-07

1681

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,681

阿里云云原生

2025-02-25

1137

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,137

阿里云云原生

2025-05-14

694

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS)，解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent（iLogtail/LoongCollector）在海外场景的应用，推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案，包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等，并提供了成本优化策略和多目标发送配置指导，帮助企业构建稳定、低成本、高可用的全球日志系统。

阿里云云原生

694

闵子

2023-12-01

2891

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,891

ModelScope

2024-05-15

1957

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,957

羽沐

2024-12-13

1994

动态链接的魔法：Linux下动态链接库机制探讨

本文将深入探讨Linux系统中的动态链接库机制，这其中包括但不限于全局符号介入、延迟绑定以及地址无关代码等内容。

羽沐

1,994

涯海

2025-01-23

969

快速定位并优化CPU 与 JVM 内存性能瓶颈

本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。

涯海

969

新念

2025-02-14

1443

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,443

言澈

2025-02-28

1192

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,192

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

白话文讲解大模型｜ Attention is all you need

解锁 DeepSeek 安全接入、稳定运行新路径

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

从浏览器原理出发聊聊Chrome插件

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

动态链接的魔法：Linux下动态链接库机制探讨

快速定位并优化CPU 与 JVM 内存性能瓶颈

DeepSeek-V3 高效训练关键技术分析

进行GPU算力管理

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

白话文讲解大模型｜ Attention is all you need

解锁 DeepSeek 安全接入、稳定运行新路径

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

从浏览器原理出发聊聊Chrome插件

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

动态链接的魔法：Linux下动态链接库机制探讨

快速定位并优化CPU 与 JVM 内存性能瓶颈

DeepSeek-V3 高效训练关键技术分析

进行GPU算力管理