官方博客-第17页-阿里云开发者社区

  • 2025-02-20
    618

    破解 vLLM + DeepSeek 规模化部署的“不可能三角”

    vLLM 是一种便捷的大型语言模型(LLM)推理服务,旨在简化个人和企业用户对复杂模型的使用。通过 vLLM,用户可以轻松发起推理请求,享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战,如大模型参数量、高效推理能力和上下文理解等,阿里云函数计算(FC)提供了 GPU 预留实例闲置计费功能,优化了性能、成本和稳定性之间的平衡。此外,FC 支持简便的部署流程和多种应用集成方式,帮助企业快速上线并管理 vLLM 服务。总结来说,vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项,满足不同业务需求。

    618
  • 2025-02-20
    571

    在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

    如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

  • 2025-02-21
    836

    基于LLM打造沉浸式3D世界

    阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索,为了解决LLMs与3D结合的问题,近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案,通过自然语言来与引擎内的3D世界进行交互。

    836
  • 2025-04-10
    468

    AI Infra之模型显存管理分析

    本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后,发现显存占用一直上升,从未下降的现象,记录了排查过程。

    468
  • 2024-05-15
    555

    Yuan2.0大模型,联合向量数据库和Llama-index,助力检索增强生成技术

    本文将以Yuan2.0最新发布的Februa模型为例进行测试验证,用更小规模的模型达到更好的效果。

  • 2024-08-21
    991

    用好通义灵码,让这款 AI 编码助手帮你做更多工作

    通义灵码提供了一系列快捷键和配置选项以增强开发体验。

  • 2024-11-06
    537

    比 Copilot 快两倍以上,在我的开源项目 AI Godot 桌宠中用通义灵码解决问题

    在我的开源项目 AI Godot 桌宠中用通义灵码解决问题。

  • 668

    云+AI时代下,Alibaba Cloud Linux 进一步演进思考

    用好开源、做深开源、自研创新,打造全方位安全可信的服务器操作系统。

  • 1
    ...
    16
    17
    18
    ...
    22
    到第
    17/22