异构计算

首页 标签 异构计算
# 异构计算 #
关注
19332内容
|
2月前
| |
来自: 物联网
I-ViT: 用于高效视觉Transformer推理的纯整数量化——论文阅读
I-ViT是首个专为视觉Transformer设计的纯整数量化方案,通过Shiftmax、ShiftGELU和I-LayerNorm实现全整数推理,避免浮点运算。在保持模型精度的同时,显著提升推理效率,实现3.7倍以上加速,推动ViT在边缘设备的高效部署。
|
2月前
| |
来自: 物联网
SparseGPT:大规模语言模型的一次性精确剪枝——论文解读
SparseGPT提出首个可高效剪枝百亿参数大模型的一次性精确方法,通过稀疏回归与近似求解器实现高稀疏度下仍保持精度,支持半结构化稀疏与量化联合压缩,显著降低推理成本。
|
2月前
|
Python实现PDF图片OCR识别:从原理到实战的全流程解析
本文详解2025年Python实现扫描PDF文本提取的四大OCR方案(Tesseract、EasyOCR、PaddleOCR、OCRmyPDF),涵盖环境配置、图像预处理、核心识别与性能优化,结合财务票据、古籍数字化等实战场景,助力高效构建自动化文档处理系统。
|
2月前
|
《URP管线中后处理效果的创新应用与优化实践》
本文以某3D奇幻角色扮演手游为案例,聚焦Unity URP管线后处理效果的应用与优化。项目采用Unity 2022.3.18f1与URP 14.0.12,目标覆盖安卓中高端机型与iOS旗舰机,初期集成6种后处理效果后,出现帧率骤降、视觉异常问题。团队通过Profiler定位Bloom与Depth of Field为性能瓶颈,从算法(如Bloom改用降采样模糊)、参数(动态调整强度)、执行顺序优化,并采用LUT分层调色解决视觉冲突,建立动态效果组合策略。优化后GPU占用降40%至15%以下,帧率稳定55帧以上,视觉评分显著提升,同时提炼“三阶段四步骤”优化方法论与前期避坑策略。
|
2月前
|
【CPOBP-NSWOA】基于豪冠猪优化BP神经网络模型的多目标鲸鱼寻优算法研究(Matlab代码实现)
【CPOBP-NSWOA】基于豪冠猪优化BP神经网络模型的多目标鲸鱼寻优算法研究(Matlab代码实现)
|
2月前
|
《拆解URP管线角色材质失效:从现象到底层的深度排障与优化》
本文以某开放世界手游项目中“动态光照场景下角色材质批量失效”问题为核心,还原技术环境(Unity 2022.3.15f1、URP 14.0.11,目标Android中高端机型),梳理问题现象(Android端角色进场景后35%概率变纯白,与点光源、阴影相关)。通过多维度排查,先排除材质参数问题,再发现Shader光照计算异常,进而定位Adreno GPU编译优化缺陷与URP光照数据同步问题。最终通过调整光照更新策略、优化Shader逻辑解决问题,同步提升性能。同时提炼排查方法论与前期避坑策略,为URP管线复杂渲染问题提供可复用的解决思路,助力开发者高效突破技术瓶颈。
|
2月前
| |
来自: 物联网
SpQR: 稀疏量化表示实现大语言模型近无损压缩——论文阅读
SpQR是一种创新的稀疏量化方法,通过识别并高精度存储导致大量化误差的异常权重,将其他权重压缩至3-4比特,实现大语言模型的近无损压缩。该方法在LLM压缩中首次跨模型规模达到接近16位精度的性能,压缩后模型平均误差低于1%。实验表明,SpQR在推理速度与压缩率上优于现有技术,使高质量大模型可在消费级设备高效运行。
|
2月前
| |
来自: 云效DevOps
从本地到云端:用 Docker Compose 与 Offload 构建可扩展 AI 智能体
在 AI 智能体开发中,开发者常面临本地调试与云端部署的矛盾。本文介绍如何通过 Docker Compose 与 Docker Offload 解决这一难题,实现从本地快速迭代到云端高效扩容的全流程。内容涵盖多服务协同、容器化配置、GPU 支持及实战案例,助你构建高效、一致的 AI 智能体开发环境。
免费试用