官方博客-第6页-阿里云开发者社区

  • 2024-05-15
    3777

    大模型推理优化实践:KV cache复用与投机采样

    在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现,并分享一些实现时的关键技巧。

    3,777
  • 2024-09-02
    3175

    【算法精讲系列】阿里云百炼SFT微调实践分享

    本内容为您提供了百炼平台SFT微调的实践案例,帮助您方便并快速借助模型微调定制化您自己的专属模型。

    3,175
  • 2025-05-08
    1596

    深度解析Agent实现,定制自己的Manus

    文章结合了理论分析与实践案例,旨在帮助读者系统地认识AI Agent的核心要素、设计模式以及未来发展方向。

    1,596
  • 2023-09-26
    138992

    云原生场景下高可用架构的最佳实践

    云原生场景下高可用架构的最佳实践

    138,992
  • 2024-09-10
    3826

    阿里云百炼|析言GBI产品入门指导

    析言基础入门的操作体验,带领大家一起探索阿里云百炼|析言GBI的奥秘。

    3,826
  • 2024-12-24
    2536

    【最佳实践系列】高并发调用百炼语音合成大模型

    本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成,适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务,文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术,并通过对比实验展示了优化效果。优化后,机器负载降低,任务耗时减少,网络负载更优。同时,文章还提供了异常处理方法及常见问题解决方案,帮助开发者更好地集成和使用SDK。

    2,536
  • 2024-12-24
    1271

    探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

    本篇文章详细讨论了如何确保大型语言模型(LLMs)输出结构化的JSON格式,这对于提高数据处理的自动化程度和系统的互操作性至关重要。

    1,271
  • 2025-02-28
    1079

    大模型推理主战场:通信协议的标配

    DeepSeek加速了模型平权,大模型推理需求激增,性能提升主战场从训练转向推理。SSE(Server-Sent Events)和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据,如一问一答场景;WebSocket支持双向实时通信,适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议,能更好地支持流式输出、长时任务处理和多轮交互,满足大模型应用的需求。随着用户体量扩大,网关层面临软件变更、带宽成本及恶意攻击等挑战,需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

    1,079
  • 2025-06-16
    532

    告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案

    生成式模型在文本生成图片等领域的快速发展,为社区带来了日新月异的诸多文生图模型。

  • 1
    ...
    5
    6
    7
    ...
    28
    到第
    6/28