官方博客-第45页-阿里云开发者社区

  • 2024-05-15
    1121

    vLLM部署Yuan2.0:高吞吐、更便捷

    vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

    1,121
  • 377

    从故障演练到运维工具产品力评测的探索 | 龙蜥技术

    随着AI和云原生技术的发展,业界运维工具百花齐放,该如何让优秀的工具脱颖而出?

  • 2024-05-16
    88519

    通义千问 2.5 “客串” ChatGPT4,看这篇让你分清楚

    这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

    88,519
  • 2024-05-16
    735

    浅谈现代消息队列与云存储

    讲述消息系统在现代化演进中软硬一体化,百万队列,分级存储等诸多竞争力特性的诞生和落地效果。探讨业界领先的 Shared-Log 存储计算分离,FFM与协程,RDMA 传输,列式存储等技术,将消息向流的领域延伸。

    735
  • 2024-06-03
    73719

    基于阿里云服务网格流量泳道的全链路流量管理(三):无侵入式的宽松模式泳道

    本文简要讨论了使用流量泳道来实现全链路流量灰度管理的场景与方案,并回顾了阿里云服务网格 ASM 提供的严格与宽松两种模式的流量泳道、以及这两种模式各自的优势与挑战。接下来介绍了一种基于 OpenTelemetry 社区提出的 baggage 透传能力实现的无侵入式的宽松模式泳道,这种类型的流量泳道同时具有对业务代码侵入性低、同时保持宽松模式的灵活特性的特点。同时,我们还介绍了新的基于权重的流量引流策略,这种策略可以基于统一的流量匹配规则,将匹配到的流量以设定好的比例分发到不同的流量泳道。

    73,719
  • 2024-07-29
    405

    从供应商深度绑定,到走向真正的云原生,他们是这样做的

    没有 K8s 的运维权限,开发者也能排查和定位问题。

  • 2024-07-31
    2817

    【产品升级】Dataphin V4.2重大升级:上线敏捷版,打通数据资产管理和消费,开启数据价值放大新篇章

    Dataphin 是阿里巴巴旗下的一个智能数据建设与治理平台,旨在帮助企业构建高效、可靠、安全的数据资产。在V4.2版本中,Dataphin敏捷版上线助力企业打造轻量版数据中台,打通数据资产管理和消费,陪伴企业迈入数据高价值应用新阶段。

    2,817
  • 2024-08-16
    8269

    PolarDB-X的TPC-H列存执行计划

    本文从官方的角度逐条解析PolarDB-X在TPC-H列存执行计划的设计要点。这些要点不仅包含了各项优化的原理,还提供了相关的证明与代码实现,希望帮助读者更深入地理解PolarDB-X的列存优化器。

    8,269
  • 1
    ...
    44
    45
    46
    ...
    73
    到第