官方博客-第48页-阿里云开发者社区

  • 2025-06-30
    427

    基于 AI 网关和 llmaz,提升 vLLM 推理服务可用性和部署易用性的实践

    本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务,并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力,构建稳定、高可用的大模型服务平台。

  • 2023-07-27
    43873

    一文详解Spring Bean循环依赖

    本文主要梳理了Spring解决bean循环依赖的思路。

  • 2023-08-04
    928

    Sentinel 2.0 微服务零信任的探索与实践

    Sentinel 2.0 微服务零信任的探索与实践

  • 2024-05-15
    1013

    浅析JAVA日志中的几则性能实践与原理解释

    本篇文章通过几个技术点说明日志记录过程中的性能实践,计算机领域的性能往往都遵循着冰山法则,即你能看得见的、程序员能感知的只是其中的一小部分,还有大量的细节隐藏在冰山之下。

    1,013
  • 2024-05-15
    252

    通过计算巢轻松部署Salt服务

    Salt基于Python构建,是一个事件驱动的自动化工具和框架,用于部署、配置和管理复杂的IT系统。使用Salt来自动化公共基础设施管理任务,并确保基础设施的所有组件都以一致的期望状态运行。 本文向您介绍如何开通计算巢上的Salt服务,以及部署流程和使用说明。

  • 2024-05-15
    545

    AIGC下一步:用AI再度重构或优化媒体处理

    LiveVideoStackCon2023深圳站,阿里云视频云演讲分享

  • 2024-05-15
    468

    计算巢AppFlow-如何在钉钉群实现智能答疑

    随着大模型能力越来越强大,利用大语言模型进行智能答疑已经成为了一个非常普遍和常见的场景。然而,各个产品或业务方要能够准确有效地进行答疑,仅依靠大模型的通用能力是远远不够的,这时候利用私有领域FAQ文档进行大模型的检索增强生成往往可以有效解决上述问题。

  • 2024-05-15
    56362

    使用 SPL 高效实现 Flink SLS Connector 下推

    SLS 推出了 SPL 语言,可以高效的对日志数据的清洗,加工。对 SPL 及 SPL 在阿里云 Flink SLS Connector 中应用进行介绍及举例。

    56,362
  • 2024-05-15
    165233

    一键开启 GPU 闲置模式,基于函数计算低成本部署 Google Gemma 模型服务

    本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

    165,233
  • 1
    ...
    47
    48
    49
    ...
    64
    到第