官方博客-第9页-阿里云开发者社区

  • 2024-05-15
    102409

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,409
  • 2024-05-15
    165214

    一键开启 GPU 闲置模式,基于函数计算低成本部署 Google Gemma 模型服务

    本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

    165,214
  • 2024-09-27
    793

    跟着iLogtail学习容器运行时与K8s下日志采集方案

    iLogtail 作为开源可观测数据采集器,对 Kubernetes 环境下日志采集有着非常好的支持,本文跟随 iLogtail 的脚步,了解容器运行时与 K8s 下日志数据采集原理。

    793
  • 2024-11-06
    1686

    Serverless 微服务治理神器: 阿里云 SAE 全链路灰度揭秘

    SAE 会继续致力于为用户提供极简易用、成本低廉、功能强大的 Serverless 应用全托管平台:“我们希望让用户做的更少而收获更多,通过 Serverless 化,深度用云就像用水电煤一样简单”。

    1,686
  • 2025-01-24
    766

    智能理解 PPT 内容,快速生成讲解视频

    本方案利用函数计算 FC 部署 Web 应用,调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容,快速生成相匹配的解说词;文本模型对解说词进行优化,提高其可读性和吸引力;语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成,只需一键操作,系统即可自动整合图片、文本和音频素材,快速生成对应讲解视频。

  • 2025-04-03
    1067

    函数计算支持热门 MCP Server 一键部署

    云上托管 MCP 搭建 AI Agent 将成为趋势。函数计算 FC 目前已经支持开源 MCP Server 一键托管,欢迎体验。

    1,067
  • 升级JSONB列式存储,Hologres助力淘宝搜索2022双11降本增效

    升级JSONB列式存储,Hologres助力淘宝搜索2022双11降本增效。

  • 2023-07-26
    1204

    PolarDB-X 私有协议2.0

    本文主要介绍私有协议2.0,也即XRPC的背景、总体设计、相关技术实现细节和性能测试结果。

  • 2024-05-15
    49918

    秒级弹性,探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

    秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?

    49,918
  • 1
    ...
    8
    9
    10
    ...
    36
    到第
    9/36