异构计算

首页 标签 异构计算
# 异构计算 #
关注
19302内容
|
1小时前
|
Qwen3-Omni多模态微调实战:从通用模型到AI智能博物官
本文介绍大模型微调技术,如何通过LLaMA Factory平台将通用Qwen3-Omni模型微调为专业文博解说AI,解决领域幻觉问题,实现从“通才”到“专才”的转变。
|
3小时前
| |
来自: 云原生
vLLM、SGLang 与 TensorRT-LLM 综合对比分析报告
vLLM、SGLang与TensorRT-LLM是三大主流大模型推理引擎。vLLM以PagedAttention实现高吞吐与易用性,适合通用场景;SGLang凭借RadixAttention和结构化生支持,在多轮对话与复杂推理中表现突出;TensorRT-LLM深度优化NVIDIA硬件,追求极致性能,适用于大规模生产部署。三者各有侧重,vLLM均衡通用,SGLang擅长复杂任务,TensorRT-LLM性能领先,选型需结合场景、硬件与成本综合考量。
|
3小时前
| |
vLLM、SGLang 与 TensorRT-LLM 综合对比分析报告
vLLM、SGLang与TensorRT-LLM是三大主流大模型推理引擎。vLLM以PagedAttention实现高吞吐与易用性,适合通用场景;SGLang凭借RadixAttention和结构化生支持,在多轮对话与复杂推理中表现突出;TensorRT-LLM深度优化NVIDIA硬件,追求极致性能,适用于大规模生产部署。三者各有侧重,vLLM均衡通用,SGLang擅长复杂任务,TensorRT-LLM性能领先,选型需结合场景、硬件与成本综合考量。
|
6小时前
|
2025年阿里云双十一活动时间、活动链接和优惠政策详细解读
2025阿里云双11已开启,至高领1728元券,AI大模型免费用7000万tokens。轻量服务器38元/年起,ECS 99元/年起,GPU实例低至1.95元/小时。企业享5亿算力补贴、10万出海权益及4万元AI优惠,覆盖全品类上云需求。
|
8小时前
|
阿里云双十一2025年优惠活动上线,你准备好了吗?免费领1728元代金券
2025阿里云双11已开启!领至高1728元代金券,享超7000万大模型tokens免费体验。轻量服务器38元/年起,ECS云服务器99元/年起,GPU实例低至1.95元/小时。企业用户可享10万出海权益、5亿算力补贴及最高4万元AI优惠,覆盖AI、数据库、存储等全品类。
|
10小时前
|
牛逼,DeepSeek-OCR 最新免费,引爆文档处理效率的黑科技模型
小华同学推荐:DeepSeek-OCR,由DeepSeek-AI开源的高效OCR工具,支持视觉压缩编码、结构化输出(如Markdown),可批量处理海量文档,适配PDF/图片,兼容vLLM,助力企业级文档自动化。
|
11小时前
|
2025年阿里云双11优惠活动盛大开启!超7000万大模型tokens免费体验
2025阿里云双11火热开启!领至高1728元优惠券,享超7000万tokens免费体验。云服务器低至38元/年起,AI大模型、GPU算力、企业出海等多重补贴,助力上云普惠升级。
|
1天前
| |
2小时打造专业医疗助手:基于CareGPT与Qwen3-8B的微调实战
基于CareGPT和Qwen3-8B模型,采用LoRA方法在专业医疗数据集上进行微调实践,该技术方案在保持模型通用能力的同时,显著提升了医疗问答的专业性和实用性,系统性地构建一个真正“懂症状、能判断”的智能医疗助手。从技术演进角度看,微调后的模型与医疗系统深度融合将释放更大价值。这种"领域微调+系统集成"的技术路径,为AI在医疗等专业场景的落地提供了经过验证的解决方案。
免费试用