官方博客-第22页-阿里云开发者社区

  • 2024-11-07
    1652

    白话文讲解大模型| Attention is all you need

    本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档,我们期望为读者提供一个全面的理解,帮助大家掌握大模型的工作原理,增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

    1,652
  • 2024-11-29
    1112

    性能提升利器|PolarDB- X 超详细列存查询技术解读

    本文将深入探讨 PolarDB-X 列存查询引擎的分层缓存解决方案,以及其在优化 ORC 列存查询性能中的关键作用。

    1,112
  • 2024-12-04
    579

    C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

    游戏行业蓬勃发展,作为国内领先的 STEAM 游戏饰品交易的服务平台,看 C5GAME 如何利用 RocketMQ Serverless 技术,为千万级玩家提供流畅的游戏体验,同时降低成本并提升运维效率。

  • 2025-01-20
    691

    1 行命令引发的Go应用崩溃

    这篇文章分析了Go编译时插桩工具导致go build -race竞态检测产生崩溃的原因。

    691
  • 2025-02-20
    701

    破解 vLLM + DeepSeek 规模化部署的“不可能三角”

    vLLM 是一种便捷的大型语言模型(LLM)推理服务,旨在简化个人和企业用户对复杂模型的使用。通过 vLLM,用户可以轻松发起推理请求,享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战,如大模型参数量、高效推理能力和上下文理解等,阿里云函数计算(FC)提供了 GPU 预留实例闲置计费功能,优化了性能、成本和稳定性之间的平衡。此外,FC 支持简便的部署流程和多种应用集成方式,帮助企业快速上线并管理 vLLM 服务。总结来说,vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项,满足不同业务需求。

    701
  • 2025-04-07
    398

    IngressNightmare:Ingress Nginx 再曝5个安全漏洞,可接管你的 K8s 集群

    是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞(CVE-2021-25745, CVE-2021-25746, CVE-2021-25748),并在那一年宣布停止接收新功能 PR,专注修复并提升稳定性。

  • 2025-04-10
    534

    AI Infra之模型显存管理分析

    本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后,发现显存占用一直上升,从未下降的现象,记录了排查过程。

    534
  • 2025-04-15
    537

    Nacos-Controller 2.0:使用 Nacos 高效管理你的 K8s 配置

    无论是使用 Nacos-Controller 实现配置的双向同步,还是直接在应用中接入 Nacos SDK 以获得更高级的配置管理特性,都能显著提升配置管理的灵活性、安全性和可维护性。使用 Nacos,您能够更好地管理和优化您的应用配置,从而提高系统的稳定性和可靠性。

  • 2023-09-15
    120019

    Hologres RoaringBitmap实践,千亿级画像数据秒级分析

    本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践,实现更快更准的画像分析。

    120,019
  • 1
    ...
    21
    22
    23
    ...
    76
    到第