官方博客-第19页-阿里云开发者社区

  • 2024-05-15
    102475

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,475
  • 2024-05-15
    110024

    FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

    Arm 架构的服务器通常具备低功耗的特性,能带来更优异的能效比。相比于传统的 x86 架构服务器,Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要,因为大模型通常需要大量的计算资源,而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

    110,024
  • 2024-05-15
    55732

    Higress 全新 Wasm 运行时,性能大幅提升

    本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

  • 森马基于MaxCompute+Hologres+DataWorks构建数据中台

    本次案例主要分享森马集团面对多年自建的多套数仓产品体系,通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台,保障数据生产稳定性与数据质量,减少ETL链路及计算时间,每年数仓整体费用从300多万降到180万。

  • 2024-09-13
    781

    Text-to-SQL技术演进 - 阿里云OpenSearch-SQL在BIRD榜单夺冠方法剖析

    本文主要介绍了阿里云OpenSearch在Text-to-SQL任务中的最新进展和技术细节。

    781
  • 1066

    拥抱Data+AI|解码Data+AI助力游戏日志智能分析

    「拥抱Data+AI」系列第2篇:阿里云DMS+AnalyticDB助力游戏日志数据分析与预测

  • 2024-11-19
    783

    基于事件驱动构建 AI 原生应用

    AI 应用在商业化服务的阶段会面临诸多挑战,比如更快的服务交付速度,更实时、精准的结果以及更人性化的体验等,传统架构限制于同步交互,无法满足上述需求,本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

    783
  • 2024-11-22
    1345

    Spring Cloud+Nacos+KMS 动态配置最佳实践

    本文讲述了 Spring Cloud 应用中结合 Nacos 实现了运行期配置动态更新的功能,以及在此基础上结合 KMS 在不改动代码的情况下对应用使用的敏感配置进行保护,解决将配置迁移到 Nacos 中可能存在的数据安全顾虑,并对其底层工作原理做了简单介绍。

    1,345
  • 2024-12-12
    600

    如何找出Java进程占用CPU高的元凶

    本文记录了一次Java进程CPU占用率过高的问题和排查思路。

    600
  • 1
    ...
    18
    19
    20
    ...
    91
    到第