官方博客-阿里云开发者社区

  • 2024-05-15
    244363

    通义千问API:用4行代码对话大模型

    本章将通过一个简单的例子,让你快速进入到通义千问大模型应用开发的世界。

    244,363
  • 2025-11-27
    1802

    大厂CIO独家分享:AI如何重塑开发者未来十年

    在 AI 时代,若你还在紧盯代码量、执着于全栈工程师的招聘,或者仅凭技术贡献率来评判价值,执着于业务提效的比例而忽略产研价值,你很可能已经被所谓的“常识”困住了脚步。

    1,802
  • 2024-11-15
    5210

    通义千问Qwen2.5-Coder 全系列来咯!强大、多样、实用

    千问团队开源了强大的 Qwen2.5-Coder 系列模型,涵盖 0.5B 到 32B 六种尺寸,旨在推动开放代码模型的发展。该系列模型在代码生成、修复和推理等方面表现出色,支持多种编程语言,并在多个基准测试中达到 SOTA 水平。此外,Qwen2.5-Coder 还提供了丰富的应用场景,如代码助手、Artifacts 和 Interpreter,满足不同开发者的需求。

  • 2025-04-24
    5240

    A2A(Agent2Agent) 简介

    本文主要介绍Google于2025年4月9日发布的Agent2Agent Protocol(简称“A2A”),这是一个旨在促进不同类型智能体(Agent)之间高效沟通与协作的开放协议。

  • 2025-04-01
    4235

    RAG 调优指南:Spring AI Alibaba 模块化 RAG 原理与使用

    通过遵循以上最佳实践,可以构建一个高效、可靠的 RAG 系统,为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面,能够帮助开发者构建更好的 RAG 应用。

    4,235
  • 2026-01-09
    421

    阿里云Tair KVCache仿真分析:高精度的计算和缓存模拟设计与实现

    在大模型推理迈向“智能体时代”的今天,KVCache 已从性能优化手段升级为系统级基础设施,“显存内缓存”模式在长上下文、多轮交互等场景下难以为继,而“以存代算”的多级 KVCache 架构虽突破了容量瓶颈,却引入了一个由模型结构、硬件平台、推理引擎与缓存策略等因素交织而成的高维配置空间。如何在满足 SLO(如延迟、吞吐等服务等级目标)的前提下,找到“时延–吞吐–成本”的最优平衡点,成为规模化部署的核心挑战。

  • 2025-03-21
    1540

    AI 推理场景的痛点和解决方案

    一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景,解决相关问题,本文我们会针对每个场景逐一说明。

    1,540
  • 2024-05-15
    69298

    通义千问API:让大模型写代码和跑代码

    基于前面三章的铺垫,本章我们将展示大模型Agent的强大能力。我们不仅要实现让大模型同时使用多种查询工具,还要实现让大模型能查询天气情况,最后让大模型自己写代码来查询天气情况。

    69,298
  • 2026-01-09
    466

    从HITL(Human In The Loop) 实践出发看Agent与设计模式的对跖点

    本文探讨在ReactAgent中引入HITL(人机回路)机制的实践方案,分析传统多轮对话的局限性,提出通过交互设计、对话挂起与工具化实现真正的人机协同,并揭示Agent演进背后与工程设计模式(如钩子、适配器、工厂模式等)的深层关联,展望未来Agent的进化方向。

    466
  • 1
    2
    3
    4
    ...
    25
    到第
    1/25