官方博客-第31页-阿里云开发者社区

  • 2025-02-20
    716

    破解 vLLM + DeepSeek 规模化部署的“不可能三角”

    vLLM 是一种便捷的大型语言模型(LLM)推理服务,旨在简化个人和企业用户对复杂模型的使用。通过 vLLM,用户可以轻松发起推理请求,享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战,如大模型参数量、高效推理能力和上下文理解等,阿里云函数计算(FC)提供了 GPU 预留实例闲置计费功能,优化了性能、成本和稳定性之间的平衡。此外,FC 支持简便的部署流程和多种应用集成方式,帮助企业快速上线并管理 vLLM 服务。总结来说,vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项,满足不同业务需求。

    716
  • 2025-04-10
    901

    0代码将存量 API 适配 MCP 协议

    本文主要讲述通过 Nacos+Higress 的方案实现0代码改造将 Agent 连接到存量应用,能够显著降低存量应用的改造成本。

  • 2025-04-16
    1427

    MCP 正当时:FunctionAI MCP 开发平台来了!

    MCP 的价值是统一了 Agent 和 LLM 之间的标准化接口,有了 MCP Server 的托管以及开发态能力只是第一步,接下来重要的是做好 MCP 和 Agent 的集成,FunctionAI 即将上线 Agent 开发能力,敬请期待。

    1,427
  • 2023-07-18
    131017

    手把手教你使用OSS-HDFS服务平替自建HDFS

    本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

    131,017
  • 2023-07-26
    1221

    PolarDB-X 私有协议2.0

    本文主要介绍私有协议2.0,也即XRPC的背景、总体设计、相关技术实现细节和性能测试结果。

  • 2023-12-01
    62660

    SLS支持高精度时间戳和全局排序

    日志内容本身是一种重要信息,日志之间的相对顺序也是因果关系的一种反映,某些场景下如果日志内容完全相同,但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

    62,660
  • 2024-05-15
    222082

    Kube Queue:Kubernetes 任务排队的利器

    Kube Queue:Kubernetes 任务排队的利器

    222,082
  • 2024-05-15
    125148

    倚天使用|YODA倚天应用迁移神器,让跨架构应用迁移变得简单高效

    YODA(Yitian Optimal Development Assistant,倚天应用迁移工具)旨在帮助用户更加高效、便捷地实现跨平台、跨结构下的应用迁移,大幅度缩短客户在新平台上端到端性能验证所需的人力和时间,使得客户更加专注于应用本身算法的优化,协同客户实现降本增效。

    125,148
  • 2024-05-15
    1108

    人人都是AI大师 - Prompt工程

    prompt工程不需要复杂的编程知识,人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程,不涉及模型训练等内容。只讨论文本生成,不涉及图像等领域。

    1,108
  • 1
    ...
    30
    31
    32
    ...
    69
    到第