官方博客-第34页-阿里云开发者社区

  • 2025-03-14
    957

    大模型无缝切换,QwQ-32B和DeepSeek-R1 全都要

    通义千问最新推出的QwQ-32B推理模型,拥有320亿参数,性能媲美DeepSeek-R1(6710亿参数)。QwQ-32B支持在小型移动设备上本地运行,并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换,涵盖环境准备、模型接入配置及客户端调用示例等内容。此外,还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能,帮助企业解决TPS与成本平衡、内容安全合规等问题,提升大模型应用的稳定性和效率。

    957
  • 2025-03-28
    233

    架构革新:揭示卓越性能与高可扩展的共赢秘诀

    为了构建现代化的可观测数据采集器LoongCollector,iLogtail启动架构通用化升级,旨在提供高可靠、高可扩展和高性能的实时数据采集和计算服务。然而,通用化的过程总会伴随性能劣化,本文重点介绍LoongCollector的性能优化之路,并对通用化和高性能之间的平衡给出见解。

    233
  • 2025-04-10
    524

    AI Infra之模型显存管理分析

    本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后,发现显存占用一直上升,从未下降的现象,记录了排查过程。

    524
  • 357

    ACK AI Profiling:从黑箱到透明的问题剖析

    本文从一个通用的客户问题出发,描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查,最后到问题定位与解决、业务执行过程的分析,从而展现一个从黑箱到透明的精细化的剖析过程。

  • 2025-08-06
    379

    JSON 日志分析的“正确姿势”:阿里云 SLS 高效实践指南

    JSON 日志因灵活易扩展而广泛应用,但其海量数据也带来分析挑战。本文系统介绍阿里云日志服务(SLS)中处理 JSON 日志的最佳实践,涵盖数据预处理、索引配置、JSON 函数使用及 SQL 智能生成,助你高效挖掘日志价值。

  • 2023-07-18
    131006

    手把手教你使用OSS-HDFS服务平替自建HDFS

    本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

    131,006
  • 2023-07-27
    43864

    一文详解Spring Bean循环依赖

    本文主要梳理了Spring解决bean循环依赖的思路。

  • 2023-08-07
    618

    MaxCompute ODPS 重装上阵,QUALIFY

    MaxCompute支持QUALIFY语法过滤Window函数的结果,使得查询语句更简洁易理解。Window函数和QUALIFY语法之间的关系可以类比聚合函数+GROUP BY语法和HAVING语法。

    618
  • 2023-09-08
    713

    MaxCompute半结构化数据思考与创新

    本文将介绍MaxCompute在半结构化数据方面的一些思考与创新,围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

    713
  • 1
    ...
    33
    34
    35
    ...
    73
    到第