开发者社区> 问答> 正文

TensorRT和TensorRT-LLM分别是什么?

TensorRT和TensorRT-LLM分别是什么?

展开
收起
夹心789 2024-06-25 22:33:18 111 0
1 条回答
写回答
取消 提交回答
  • TensorRT是NVIDIA提供的高性能深度学习推理SDK,包含优化器和运行环境,为深度学习推理应用提供低延迟和高吞吐量。而TensorRT-LLM是专门用于编译和优化大语言模型推理的工具,可加速和优化大语言模型在NVIDIA GPU上的推理性能。

    2024-06-26 09:56:11
    赞同 1 展开评论 打赏
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
PAI灵骏智算 构建全链路LLM服务的最佳实践 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载