官方博客-第12页-阿里云开发者社区

  • 2024-05-15
    1321

    vLLM部署Yuan2.0:高吞吐、更便捷

    vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

    1,321
  • 2024-09-25
    996

    新场景、新能力,AI-native 时代的可观测革新

    借助 AI-native 可观测解决方案,阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力,帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

  • 2025-01-26
    1394

    最近谈论 SSE 和 WebSocket 的人越来越多的原因

    实时通信已经成了大模型应用的标配。

  • 2025-07-10
    948

    用 AI + 高德地图 MCP,3 小时做出杭州美食地图

    本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践,通过结合 Cursor 与高德 MCP 地图服务平台,作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

    948
  • 2024-05-15
    903

    Mistral 7B v0.2 基础模型开源,魔搭社区微调教程和评测来啦!

    Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型,有如下几个特点

  • 2024-05-15
    67438

    无需重新学习,使用 Kibana 查询/可视化 SLS 数据

    本文演示了使用 Kibana 连接 SLS ES 兼容接口进行查询和分析的方法。

  • 2024-08-26
    407

    打破传统叙事逻辑,构建基于原子化任务的人机交互

    在复杂中后台设计中,为解决配置变更影响多场景问题,提出结合正向和逆向信息架构,采用原子化任务,动态组合任务,降低用户和开发成本,优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

    407
  • 2025-09-24
    667

    配置驱动的动态 Agent 架构网络:实现高效编排、动态更新与智能治理

    本文所阐述的配置驱动智能 Agent 架构,其核心价值在于为 Agent 开发领域提供了一套通用的、可落地的标准化范式。

  • 2024-05-15
    110143

    FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

    Arm 架构的服务器通常具备低功耗的特性,能带来更优异的能效比。相比于传统的 x86 架构服务器,Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要,因为大模型通常需要大量的计算资源,而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

    110,143
  • 1
    ...
    11
    12
    13
    ...
    43
    到第