官方博客-第22页-阿里云开发者社区

裘展

2024-11-07

1652

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,652

君启

2024-11-29

1112

性能提升利器｜PolarDB- X 超详细列存查询技术解读

本文将深入探讨 PolarDB-X 列存查询引擎的分层缓存解决方案，以及其在优化 ORC 列存查询性能中的关键作用。

君启

1,112

邹星宇刘尧

2024-12-04

579

C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

游戏行业蓬勃发展，作为国内领先的 STEAM 游戏饰品交易的服务平台，看 C5GAME 如何利用 RocketMQ Serverless 技术，为千万级玩家提供流畅的游戏体验，同时降低成本并提升运维效率。

邹星宇刘尧

579

青风

2025-01-20

691

1 行命令引发的Go应用崩溃

这篇文章分析了Go编译时插桩工具导致go build -race竞态检测产生崩溃的原因。

青风

691

亦达

2025-02-20

701

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

701

望宸魁宇

2025-04-07

398

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

398

望雲十雨言澈

2025-04-10

534

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

534

濯光翼严

2025-04-15

537

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

无论是使用 Nacos-Controller 实现配置的双向同步，还是直接在应用中接入 Nacos SDK 以获得更高级的配置管理特性，都能显著提升配置管理的灵活性、安全性和可维护性。使用 Nacos，您能够更好地管理和优化您的应用配置，从而提高系统的稳定性和可靠性。

濯光翼严

537

致问

2023-09-15

120019

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,019

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

白话文讲解大模型｜ Attention is all you need

性能提升利器｜PolarDB- X 超详细列存查询技术解读

C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

1 行命令引发的Go应用崩溃

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

AI Infra之模型显存管理分析

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

白话文讲解大模型｜ Attention is all you need

性能提升利器｜PolarDB- X 超详细列存查询技术解读

C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

1 行命令引发的Go应用崩溃

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

AI Infra之模型显存管理分析

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

Hologres RoaringBitmap实践，千亿级画像数据秒级分析