官方博客-第4页-阿里云开发者社区

  • 2024-11-29
    731

    作为开发者,我如何提高任务型大模型应用的响应性能

    本文基于实际场景,分享了作为开发者提高大模型响应性能的四个实用方法。

    731
  • 2025-01-02
    509

    阿里云百炼产品月刊【2024年12月】

    12月,阿里云百炼带来多项技术革新与服务升级。本月重点包括VL模型部分规格降价,上线多个新模型,如视觉推理模型qvq-72b-preview、多语言文本统一排序模型gte-rerank和人物视频生成模型videoretalk等。应用模块新增音视频互动、互联网搜索及意图选择等功能,极大丰富了应用场景。此外,新增Context Cache功能和batch调用支持,提升了响应速度并降低了费用。

    509
  • 2024-11-01
    560

    探索LLM推理全阶段的JSON格式输出限制方法

    文章详细讨论了如何确保大型语言模型(LLMs)输出结构化的JSON格式,这对于提高数据处理的自动化程度和系统的互操作性至关重要。

    560
  • 2024-11-06
    394

    基于开源框架Spring AI Alibaba快速构建Java应用

    本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba,提升基于 Java 的大模型应用开发效率和安全性。

    394
  • 2024-11-07
    796

    白话文讲解大模型| Attention is all you need

    本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档,我们期望为读者提供一个全面的理解,帮助大家掌握大模型的工作原理,增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

    796
  • 2024-12-02
    737

    阿里云百炼产品月刊【2024年11月】

    11月,阿里云百炼平台迎来一系列重大更新,包括推出QwQ、qwen-turbo、qwen-Plus等多个新模型及快照版本,强化AI推理、文本生成、视觉理解等能力。此外,还优化了模型管理、数据处理等功能,提升了用户体验。

    737
  • 2025-01-16
    232

    现身说法,AI小白的大模型学习路径

    写这篇文章的初衷:作为一个AI小白,把我自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大模型时代,看出点门道。

    232
  • 2024-05-15
    2735

    Qwen1.5-MoE开源,魔搭社区推理训练最佳实践教程来啦

    通义千问团队推出Qwen系列的首个MoE模型,Qwen1.5-MoE-A2.7B。

    2,735
  • 2024-05-15
    2207

    大模型推理优化实践:KV cache复用与投机采样

    在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现,并分享一些实现时的关键技巧。

    2,207
  • 1
    ...
    3
    4
    5
    ...
    28
    到第
    4/28