官方博客-第28页-阿里云开发者社区

  • 2025-02-20
    250

    破解 vLLM + DeepSeek 规模化部署的“不可能三角”

    vLLM 是一种便捷的大型语言模型(LLM)推理服务,旨在简化个人和企业用户对复杂模型的使用。通过 vLLM,用户可以轻松发起推理请求,享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战,如大模型参数量、高效推理能力和上下文理解等,阿里云函数计算(FC)提供了 GPU 预留实例闲置计费功能,优化了性能、成本和稳定性之间的平衡。此外,FC 支持简便的部署流程和多种应用集成方式,帮助企业快速上线并管理 vLLM 服务。总结来说,vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项,满足不同业务需求。

    250
  • 2023-05-15
    7231

    消息队列之 MetaQ 和 Kafka 区别和优势详解

    本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

    7,231
  • 2023-05-29
    5522

    AnalyticDB(ADB)+LLM,构建AIGC时代下企业专属Chatbot

    如何基于向量数据库+LLM(大语言模型),打造更懂你的企业专属Chatbot。

  • 2023-09-08
    576

    MaxCompute半结构化数据思考与创新

    本文将介绍MaxCompute在半结构化数据方面的一些思考与创新,围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

    576
  • 2023-11-01
    2249

    PolarDB-X V2.3 集中式和分布式一体化开源发布

    本文主要介绍PolarDB-X V2.3 集中式和分布式一体化开源。

  • 2024-05-15
    854

    基于PAI-DSW快速启动Stable Diffusion WebUI

    基于PAI-DSW快速启动Stable Diffusion WebUI,创作你的专属冬日主题AI画作!

    854
  • 2024-05-15
    634

    MSE Nacos,解决敏感配置的安全隐患

    本文向大家介绍,MSE Nacos 是如何解决敏感配置的安全隐患,并提供使用 MSE Nacos 加解密敏感配置的最佳实践。

  • 2024-05-15
    61623

    走进RDS之MySQL内存分配与管理(中)

    MySQL内存分配与管理总体上分为上中下三篇介绍,本篇为中篇,主要介绍 InnoDB 的内存构成和使用,代码版本主要基于8.0.25。

    61,623
  • 2024-05-15
    591

    MSE Nacos 配置变更审计平台使用指南

    MSE Nacos 配置变更审计平台使用指南

    591
  • 1
    ...
    27
    28
    29
    ...
    51
    到第