官方博客-第7页-阿里云开发者社区

  • 2025-05-22
    2528

    Spring AI Alibaba 发布企业级 MCP 分布式部署方案

    本文介绍了Spring AI Alibaba MCP的开发与应用,旨在解决企业级AI Agent在分布式环境下的部署和动态更新问题。通过集成Nacos,Spring AI Alibaba实现了流量负载均衡及节点变更动态感知等功能。开发者可方便地将企业内部业务系统发布为MCP服务或开发自己的AI Agent。文章详细描述了如何通过代理应用接入存量业务系统,以及全新MCP服务的开发流程,并提供了完整的配置示例和源码链接。未来,Spring AI Alibaba计划结合Nacos3的mcp-registry与mcp-router能力,进一步优化Agent开发体验。

    2,528
  • 2024-11-29
    2369

    作为开发者,我如何提高任务型大模型应用的响应性能

    本文基于实际场景,分享了作为开发者提高大模型响应性能的四个实用方法。

    2,369
  • 2025-03-21
    1407

    监控vLLM等大模型推理性能

    本文将深入探讨 AI 推理应用的可观测方案,并基于 Prometheus 规范提供一套完整的指标观测方案,帮助开发者构建稳定、高效的推理应用。

    1,407
  • 2024-05-15
    1685

    从零构建现代深度学习框架(TinyDL-0.01)

    本文主要以一个Java工程师视角,阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架(类比AI的操作系统)。

    1,685
  • 2024-09-02
    3555

    【算法精讲系列】阿里云百炼SFT微调实践分享

    本内容为您提供了百炼平台SFT微调的实践案例,帮助您方便并快速借助模型微调定制化您自己的专属模型。

    3,555
  • 2025-02-20
    874

    大模型推理服务全景图

    推理性能的提升涉及底层硬件、模型层,以及其他各个软件中间件层的相互协同,因此了解大模型技术架构的全局视角,有助于我们对推理性能的优化方案进行评估和选型。

    874
  • 2024-08-16
    16590

    RAG效果优化:高质量文档解析详解

    本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

  • 2025-04-01
    3612

    RAG 调优指南:Spring AI Alibaba 模块化 RAG 原理与使用

    通过遵循以上最佳实践,可以构建一个高效、可靠的 RAG 系统,为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面,能够帮助开发者构建更好的 RAG 应用。

    3,612
  • 2025-05-29
    2377

    管理和调度Dify工作流

    Dify是一款开源的大模型应用开发平台,支持通过可视化界面快速构建AI Agent和工作流。然而,Dify本身缺乏定时调度与监控报警功能,且执行记录过多可能影响性能。为解决这些问题,可采用Dify Schedule或XXL-JOB集成Dify工作流。Dify Schedule基于GitHub Actions实现定时调度,但仅支持公网部署、调度延时较大且配置复杂。相比之下,XXL-JOB提供秒级调度、内网安全防护、限流控制及企业级报警等优势,更适合大规模、高精度的调度需求。两者对比显示,XXL-JOB在功能性和易用性上更具竞争力。

    2,377
  • 1
    ...
    6
    7
    8
    ...
    43
    到第