文章标签：

大模型服务平台百炼

关键词：

阿里云人工智能平台 PAI

大模型服务平台百炼大模型

大模型服务平台百炼模型训练

大模型服务平台百炼服务

大模型人工智能平台 PAI

八进智

6月前

缓存物联网 PyTorch

使用TensorRT LLM构建和运行Qwen模型

本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型，涵盖模型转换、引擎构建、量化推理及LoRA微调等操作，并提供详细的代码示例与支持矩阵。

八进智

1549 2 2

代码bug生产队

6月前

人工智能搜索推荐程序员

当AI学会“跨界思考”：多模态模型如何重塑人工智能

代码bug生产队

763 120 120

安全风信子

6月前

缓存 API 调度

70_大模型服务部署技术对比：从框架到推理引擎

在2025年的大模型生态中，高效的服务部署技术已成为连接模型能力与实际应用的关键桥梁。随着大模型参数规模的不断扩大和应用场景的日益复杂，如何在有限的硬件资源下实现高性能、低延迟的推理服务，成为了所有大模型应用开发者面临的核心挑战。

安全风信子

850 0 0

安全风信子

6月前

存储运维监控

57_大模型监控与运维：构建稳定可靠的服务体系

随着大语言模型(LLM)技术的快速发展和广泛应用，如何确保模型在生产环境中的稳定运行、高效服务和安全合规已成为企业和开发者面临的关键挑战。2025年，大模型服务已从实验室走向各行各业的核心业务流程，其运维复杂度也随之呈指数级增长。与传统软件系统不同，大模型服务具有参数规模庞大、计算密集、行为不确定性高等特点，这使得传统的运维监控体系难以满足需求。

安全风信子

1116 0 0

安全风信子

6月前

存储机器学习/深度学习人工智能

54_模型优化：大模型的压缩与量化

随着大型语言模型(LLM)的快速发展，模型规模呈指数级增长，从最初的数亿参数到如今的数千亿甚至万亿参数。这种规模扩张带来了惊人的能源消耗和训练成本，同时也给部署和推理带来了巨大挑战。2025年，大模型的"瘦身"已成为行业发展的必然趋势。本文将深入剖析大模型压缩与量化的核心技术、最新进展及工程实践，探讨如何通过创新技术让大模型在保持高性能的同时实现轻量化部署，为企业和开发者提供全面的技术指导。

安全风信子

528 0 0

安全风信子

6月前

机器学习/深度学习人工智能自然语言处理

38_多模态模型：CLIP的视觉-语言对齐_深度解析

想象一下，当你看到一张小狗在草地上奔跑的图片时，你的大脑立刻就能将视觉信息与"小狗"、"草地"、"奔跑"等概念联系起来。这种跨模态的理解能力对于人类来说似乎是理所当然的，但对于人工智能系统而言，实现这种能力却经历了长期的技术挑战。多模态学习的出现，标志着AI从单一模态处理向更接近人类认知方式的综合信息处理迈出了关键一步。

安全风信子

1099 0 0

modelscope

7月前

自然语言处理机器人图形学

腾讯混元图像3.0正式开源发布！80B，首个工业级原生多模态生图模型

腾讯混元图像3.0，真的来了——开源，免费开放使用。正式介绍一下：混元图像3.0（HunyuanImage 3.0），是首个工业级原生多模态生图模型，参数规模80B，也是目前测评效果最好、参数量最大的开源生图模型，效果可对…

modelscope

1386 2 2

阿里云百炼

热门文章

最新文章

相关产品

相关解决方案

相关课程

相关电子书

相关实验场景