官方博客-阿里云开发者社区

  • 2025-02-28
    308

    进行GPU算力管理

    本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下,对GPU算力管理和分配带来的挑战。以及面对这些挑战,GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

    308
  • 2025-01-14
    648

    Spring AI 智能体通过 MCP 集成本地文件数据

    MCP 作为一款开放协议,直接规范了应用程序如何向 LLM 提供上下文。MCP 就像是面向 AI 应用程序的 USB-C 端口,正如 USB-C 提供了一种将设备连接到各种外围设备和配件的标准化方式一样,MCP 提供了一个将 AI 模型连接到不同数据源和工具的标准化方法。

    648
  • 2025-02-10
    1182

    对话|ESA助力企业高效安全开展在线业务

    ESA如何助力企业安全开展在线业务

  • 2025-01-07
    1890

    阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点

    本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景,帮助开发者和技术小白快速上手,体验AI的强大能力,并探索企业级AI应用开发的可能性。

    1,890
  • 2024-10-31
    277

    基于 EventBridge + DashVector 打造 RAG 全链路动态语义检索能力

    本文将演示如何使用事件总线(EventBridge),向量检索服务(DashVector),函数计算(FunctionCompute)结合灵积模型服务[1]上的 Embedding API[2],来从 0 到 1 构建基于文本索引的构建+向量检索基础上的语义搜索能力。具体来说,我们将基于 OSS 文本文档动态插入数据,进行实时的文本语义搜索,查询最相似的相关内容。

    277
  • 2024-07-29
    19046

    LLM 应用可观测性:从 Trace 视角展开的探索与实践之旅

    基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点,本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战,近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践,一起来了解下吧。

    19,046
  • 2024-12-02
    342

    一行代码都不改,Golang 应用链路指标日志全知道

    本文将通过阿里云开源的 Golang Agent,帮助用户实现“一行代码都不改”就能获取到应用产生的各种观测数据,同时提升运维团队和研发团队的幸福感。

    342
  • 2025-01-26
    519

    最近谈论 SSE 和 WebSocket 的人越来越多的原因

    实时通信已经成了大模型应用的标配。

  • 1
    2
    3
    4
    ...
    24
    到第
    1/24