官方博客-第25页-阿里云开发者社区

  • 2025-02-20
    689

    破解 vLLM + DeepSeek 规模化部署的“不可能三角”

    vLLM 是一种便捷的大型语言模型(LLM)推理服务,旨在简化个人和企业用户对复杂模型的使用。通过 vLLM,用户可以轻松发起推理请求,享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战,如大模型参数量、高效推理能力和上下文理解等,阿里云函数计算(FC)提供了 GPU 预留实例闲置计费功能,优化了性能、成本和稳定性之间的平衡。此外,FC 支持简便的部署流程和多种应用集成方式,帮助企业快速上线并管理 vLLM 服务。总结来说,vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项,满足不同业务需求。

    689
  • 2025-02-21
    879

    基于LLM打造沉浸式3D世界

    阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索,为了解决LLMs与3D结合的问题,近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案,通过自然语言来与引擎内的3D世界进行交互。

    879
  • 2025-06-16
    491

    告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案

    生成式模型在文本生成图片等领域的快速发展,为社区带来了日新月异的诸多文生图模型。

  • 2025-06-30
    405

    基于 AI 网关和 llmaz,提升 vLLM 推理服务可用性和部署易用性的实践

    本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务,并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力,构建稳定、高可用的大模型服务平台。

  • 2024-02-18
    134768

    Higress × OpenKruiseGame 游戏网关最佳实践

    本文将演示 Higress 如何无缝对接 OKG 游戏服,并为其带来的优秀特性。

    134,768
  • 2024-05-15
    108443

    深度剖析 RocketMQ 5.0,Apache RocketMQ:如何从互联网时代演进到云时代?

    从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构,最后再分别从业务场景切入,详细介绍 RocketMQ 5.0 在不同的业务场景提供的能力和关键技术原理,包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

    108,443
  • 2024-05-15
    79461

    深度剖析 RocketMQ 5.0,事件驱动:云时代的事件驱动有啥不同?

    本文技术理念的层面了解一下事件驱动的概念。RocketMQ 5.0 在面向云时代的事件驱动架构新推出的子产品 EventBridge,最后再结合几个具体的案例帮助大家了解云时代的事件驱动方案。

    79,461
  • 2024-05-15
    474

    奇思妙想的SQL|兼顾性能的数据倾斜处理新姿势

    本篇为系列第2篇,分享在支付宝支付数据链路改造升级过程中,针对数据倾斜的优化实践新方法,在解决数据倾斜问题的同时,还能兼顾更优的计算性能!

    474
  • 2024-05-15
    1078

    云数据库专属集群MyBase在金融云的物理围笼实践

    本文档详细介绍基于云数据库专属集群MyBase在金融公共云部署物理围笼实践的方案。

    1,078
  • 1
    ...
    24
    25
    26
    ...
    60
    到第