官方博客-第34页-阿里云开发者社区

  • 2024-08-26
    704

    AI 网关基于 IP 地理位置,增强 Prompt 修饰能力

    本⽂对 Prompt 的使用方式进行了简单介绍,让大家了解到 Prompt 对于 LLM 的重要性。并尝试在 Prompt 中结合用户 Geo IP 信息,实现 LLM 的个性化回复,提升问答的准确度。

  • 2024-10-18
    1046

    海量大模型如何一键部署上云,函数计算 x ModelScope 社区给出答案

    得益于阿里云函数计算的产品能力,魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩(缩零能力)、GPU 虚拟化(最小 1GB 显存粒度)、异步调用能力、按用付费、闲置计费等能力,这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

  • 2024-10-31
    538

    基于 EventBridge + DashVector 打造 RAG 全链路动态语义检索能力

    本文将演示如何使用事件总线(EventBridge),向量检索服务(DashVector),函数计算(FunctionCompute)结合灵积模型服务[1]上的 Embedding API[2],来从 0 到 1 构建基于文本索引的构建+向量检索基础上的语义搜索能力。具体来说,我们将基于 OSS 文本文档动态插入数据,进行实时的文本语义搜索,查询最相似的相关内容。

    538
  • 2024-11-06
    630

    比 Copilot 快两倍以上,在我的开源项目 AI Godot 桌宠中用通义灵码解决问题

    在我的开源项目 AI Godot 桌宠中用通义灵码解决问题。

  • 2024-12-04
    213

    阿里云可观测 2024 年 11 月产品动态

    阿里云可观测 2024 年 11 月产品动态。

  • 2024-12-10
    273

    微服务引擎 MSE 及云原生 API 网关 2024 年 11 月产品动态

    微服务引擎 MSE 及云原生 API 网关 2024 年 11 月产品动态。

  • 2025-01-14
    211

    微服务引擎 MSE 及云原生 API 网关 2024 年 12 月产品动态

    微服务引擎 MSE 及云原生 API 网关 2024 年 12 月产品动态。

  • 2025-02-19
    205

    阿里云可观测 2025 年 1 月产品动态

    阿里云可观测 2025 年 1 月产品动态。

  • 2025-02-20
    800

    破解 vLLM + DeepSeek 规模化部署的“不可能三角”

    vLLM 是一种便捷的大型语言模型(LLM)推理服务,旨在简化个人和企业用户对复杂模型的使用。通过 vLLM,用户可以轻松发起推理请求,享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战,如大模型参数量、高效推理能力和上下文理解等,阿里云函数计算(FC)提供了 GPU 预留实例闲置计费功能,优化了性能、成本和稳定性之间的平衡。此外,FC 支持简便的部署流程和多种应用集成方式,帮助企业快速上线并管理 vLLM 服务。总结来说,vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项,满足不同业务需求。

    800
  • 1
    ...
    33
    34
    35
    ...
    44
    到第