官方博客-第5页-阿里云开发者社区

  • 2023-08-31
    564

    为什么 Higress 是 Knative 入口网关的最佳实践

    Knative Serving 是一款基于 K8s 的 Serverless 开源平台,用于构建和管理现代化、可拓展、流量驱动、无服务器的应用程序。本文重点关注 Knative 网络层能力的实现。

    564
  • 2023-09-26
    138828

    云原生场景下高可用架构的最佳实践

    云原生场景下高可用架构的最佳实践

    138,828
  • 2024-05-15
    102327

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,327
  • 2024-05-15
    221992

    Kube Queue:Kubernetes 任务排队的利器

    Kube Queue:Kubernetes 任务排队的利器

    221,992
  • 2024-05-15
    1353

    全景剖析阿里云容器网络数据链路(三)—— Terway ENIIP

    本文是[全景剖析容器网络数据链路]第三部分,主要介绍Kubernetes Terway ENIIP模式下,数据面链路的转转发链路。

    1,353
  • 2025-01-14
    431

    政采云业务网关实践:使用 Higress 统一替代 APISIX/Kong/Istio Ingress

    政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

    431
  • 2025-02-07
    630

    浏览量超 10w 的热图,描述 RAG 的主流架构

    大模型性能的持续提升,进一步挖掘了 RAG 的潜力,RAG 将检索系统与生成模型相结合,带来诸多优势,如实时更新知识、降低成本等。点击本文,为您梳理 RAG 的基本信息,并介绍提升大模型生成结果的方法,快一起看看吧~

    630
  • 2023-08-11
    1495

    Linux 内存管理新特性:Memory folios 解读

    本文主要讲解folio ,极其在应用中的直接价值。

    1,495
  • 2024-05-15
    112154

    RocketMQ 流数据库解析:实现一体化流处理

    RocketMQ 5.0 是一款云原生的消息中间件,旨在覆盖更多业务场景。它针对国内企业在数字化转型中面临的多场景消息处理需求,提供了一体化的解决方案。

    112,154
  • 1
    ...
    4
    5
    6
    ...
    28
    到第
    5/28