异构计算

首页 标签 异构计算
# 异构计算 #
关注
19331内容
|
10天前
|
牛逼,DeepSeek-OCR 最新免费,引爆文档处理效率的黑科技模型
小华同学推荐:DeepSeek-OCR,由DeepSeek-AI开源的高效OCR工具,支持视觉压缩编码、结构化输出(如Markdown),可批量处理海量文档,适配PDF/图片,兼容vLLM,助力企业级文档自动化。
|
10天前
|
2025年阿里云双11优惠活动盛大开启!超7000万大模型tokens免费体验
2025阿里云双11火热开启!领至高1728元优惠券,享超7000万tokens免费体验。云服务器低至38元/年起,AI大模型、GPU算力、企业出海等多重补贴,助力上云普惠升级。
|
11天前
| |
2小时打造专业医疗助手:基于CareGPT与Qwen3-8B的微调实战
基于CareGPT和Qwen3-8B模型,采用LoRA方法在专业医疗数据集上进行微调实践,该技术方案在保持模型通用能力的同时,显著提升了医疗问答的专业性和实用性,系统性地构建一个真正“懂症状、能判断”的智能医疗助手。从技术演进角度看,微调后的模型与医疗系统深度融合将释放更大价值。这种"领域微调+系统集成"的技术路径,为AI在医疗等专业场景的落地提供了经过验证的解决方案。
|
12天前
|
大模型推理优化:推测解码技术详解
本文深入解析大语言模型推理中的革命性技术——推测解码(Speculative Decoding)。通过分析自回归解码的序列性瓶颈,详细阐述推测解码的核心原理、验证机制和实现策略。文章包含完整的算法实现、多方案性能对比以及实际部署指南,展示如何在不影响生成质量的前提下将推理速度提升2-3倍。
|
13天前
|
阿里云服务器多少钱一年?亲自整理ECS、轻量和GPU服务器租赁价格表
2025年阿里云服务器优惠汇总:轻量应用服务器2核2G 38元/年起,ECS 2核2G 99元/年,2核4G 199元/年,4核16G 89元/月,8核32G 160元/月,香港轻量25元/月起,新老用户同享,续费同价。
|
14天前
|
《3D端游开放世界动态天气系统与场景交互优化实践日志》
本文记录现代都市3D端游动态天气系统优化过程,此前系统切换天气(如晴转暴雨伴雷电)时帧率骤降、交互逻辑断层且有光照闪屏问题,粒子系统CPU占用率达18%。优化从三方面展开:粒子系统按场景分高、中、低精度管控,结合渐变过渡避免负载骤增;建立“天气-物体-属性”数据库,让积水、积雪交互符合现实逻辑;通过多阶段缓冲与光照优化解决切换卡顿和闪屏。最终粒子CPU占用率≤8%,帧率波动≤5帧,多人联机也能稳定60帧,交互真实度大幅提升。
|
14天前
|
大模型分布式推理:张量并行与流水线并行技术
本文深入探讨大语言模型分布式推理的核心技术——张量并行与流水线并行。通过分析单GPU内存限制下的模型部署挑战,详细解析张量并行的矩阵分片策略、流水线并行的阶段划分机制,以及二者的混合并行架构。文章包含完整的分布式推理框架实现、通信优化策略和性能调优指南,为千亿参数大模型的分布式部署提供全面解决方案。
|
14天前
|
Kubernetes集群中,部分使用GPU资源的Pod出现UnexpectedAdmissionError问题的解决方案。
如果在进行上述检查之后,问题依然存在,可以尝试创建一个最小化的Pod配置,仅请求GPU资源而不
免费试用