官方博客-第12页-阿里云开发者社区

  • 2025-06-24
    436

    通义灵码用户说 | 编程智能体+MCP加持,秒查附近蜜雪冰城

    通义灵码现已全面支持Qwen3,新增智能体模式,具备自主决策、环境感知、工具使用等能力,可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换,结合MCP工具与记忆功能,提升开发效率。AI IDE重构编程流程,让开发更智能高效。

  • 2024-05-15
    102327

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,327
  • 2024-05-15
    117949

    阿里云PAI大模型RAG对话系统最佳实践

    本文为大模型RAG对话系统最佳实践,旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术,从而显著提升对话系统的性能,使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践,您可以掌握构建一个大模型RAG对话系统的完整开发链路。

    117,949
  • 2024-05-15
    1074

    vLLM部署Yuan2.0:高吞吐、更便捷

    vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

    1,074
  • 2024-05-15
    104577

    手把手教你捏一个自己的Agent

    Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用,用于方便地创建针对各种现实应用量身定制智能体,目前已经在生产级别落地。

    104,577
  • 2024-11-21
    538

    构建理想容器镜像——以CSI为例

    本文围绕阿里云CSI(Container Storage Interface)镜像构建的实际案例,探讨了一系列优化容器镜像的最佳实践。

    538
  • 2024-12-06
    913

    【实战干货】AI大模型工程应用于车联网场景的实战总结

    本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势,以及这些技术如何应用于新能源汽车行业的车联网服务中。

    913
  • 2024-12-06
    1224

    【阅读十分钟,百分百成功】——通过大模型实现对客服回答的质量评估

    本文章基于业务实践,总结有关客服质检场景的解决方案和处理经验,为相似场景提供可行的借鉴方法。

    1,224
  • 2024-05-15
    221994

    Kube Queue:Kubernetes 任务排队的利器

    Kube Queue:Kubernetes 任务排队的利器

    221,994
  • 1
    ...
    11
    12
    13
    ...
    27
    到第
    12/27