官方博客-第28页-阿里云开发者社区

  • 2025-02-20
    800

    破解 vLLM + DeepSeek 规模化部署的“不可能三角”

    vLLM 是一种便捷的大型语言模型(LLM)推理服务,旨在简化个人和企业用户对复杂模型的使用。通过 vLLM,用户可以轻松发起推理请求,享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战,如大模型参数量、高效推理能力和上下文理解等,阿里云函数计算(FC)提供了 GPU 预留实例闲置计费功能,优化了性能、成本和稳定性之间的平衡。此外,FC 支持简便的部署流程和多种应用集成方式,帮助企业快速上线并管理 vLLM 服务。总结来说,vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项,满足不同业务需求。

    800
  • 2024-05-15
    1018

    基于PAI-DSW快速启动Stable Diffusion WebUI

    基于PAI-DSW快速启动Stable Diffusion WebUI,创作你的专属冬日主题AI画作!

    1,018
  • 2024-05-15
    61848

    走进RDS之MySQL内存分配与管理(中)

    MySQL内存分配与管理总体上分为上中下三篇介绍,本篇为中篇,主要介绍 InnoDB 的内存构成和使用,代码版本主要基于8.0.25。

    61,848
  • 2024-05-15
    162757

    充分发挥 SQL 能力

    MaxCompute(ODPS)SQL 发展到今天已经颇为成熟,作为一种 SQL 方言,可以高效地应用在各种数据处理场景。本文尝试独辟蹊径,强调通过灵活的、发散性的数据处理思维,就可以用最基础的语法,解决复杂的数据场景。

    162,757
  • 2024-05-15
    125189

    倚天使用|YODA倚天应用迁移神器,让跨架构应用迁移变得简单高效

    YODA(Yitian Optimal Development Assistant,倚天应用迁移工具)旨在帮助用户更加高效、便捷地实现跨平台、跨结构下的应用迁移,大幅度缩短客户在新平台上端到端性能验证所需的人力和时间,使得客户更加专注于应用本身算法的优化,协同客户实现降本增效。

    125,189
  • 2024-05-15
    1171

    人人都是AI大师 - Prompt工程

    prompt工程不需要复杂的编程知识,人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程,不涉及模型训练等内容。只讨论文本生成,不涉及图像等领域。

    1,171
  • 1214

    数据库索引回表困难,揭秘PolarDB存储引擎优化技术

    PolarDB分布式版存储引擎采用CSM方案均衡资源开销与可用性。

  • 2024-08-21
    1097

    用好通义灵码,让这款 AI 编码助手帮你做更多工作

    通义灵码提供了一系列快捷键和配置选项以增强开发体验。

  • 2024-09-03
    382

    MySQL 8.0:filesort 性能退化的问题分析

    用户将 RDS MySQL 实例从 5.6 升级到 8.0 后,发现相同 SQL 的执行时间增长了十几倍。本文就该问题逐步展开排查,并最终定位根因。

    382
  • 1
    ...
    27
    28
    29
    ...
    43
    到第