官方博客-第25页-阿里云开发者社区

  • 2024-05-15
    1138

    vLLM部署Yuan2.0:高吞吐、更便捷

    vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

    1,138
  • 2024-05-15
    1120

    全景剖析阿里云容器网络数据链路(六)—— ASM Istio

    本文是[全景剖析容器网络数据链路]第六部分部分,主要介绍ASM Istio模式下,数据面链路的转转发链路。

    1,120
  • 2024-05-16
    88535

    通义千问 2.5 “客串” ChatGPT4,看这篇让你分清楚

    这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

    88,535
  • 707

    内附原文|SIGMOD’24:百万核的智能调度,云数仓如何结合AI处理用户混合负载

    论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性,解决了云数据仓库的性能瓶颈,同时支持了资源按需预留。Flux优于传统的方法,查询响应时间 (RT) 最多可减少75%,资源利用率提高19.0%,成本开销降低77.8%。

  • 2024-08-15
    11748

    动手实践:高效构建企业级AI搜索

    本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用,以及搭建演示等。

    11,748
  • 2024-09-04
    547

    用Prompt技巧激发无限创意

    本文深入探讨当前最前沿的prompt engineering方案,结合OpenAI、Anthropic和Google等大模型公司的资料,以及开源社区中宝贵的prompt技巧分享,全面解析这一领域的实践策略。

    547
  • 2024-09-09
    382

    Java字符串拼接技术演进及阿里巴巴的贡献

    本文主要讲述了Java字符串拼接技术的演进历程,以及阿里巴巴贡献的最新实现 PR 20273。

    382
  • 2024-09-10
    468

    浅析MySQL Join Reorder算法

    本文浅析了MySQL Join Reorder算法的流程,cost计算,剪枝算法等,希望通过本文能帮助大家了解MySQL优化器生成执行计划的具体流程。

    468
  • 1
    ...
    24
    25
    26
    ...
    63
    到第