并行计算

首页 标签 并行计算
# 并行计算 #
关注
5421内容
离散偶极子近似(DDA)求解颗粒散射的MATLAB实现
离散偶极子近似(Discrete Dipole Approximation, DDA)是一种计算电磁散射问题的数值方法,特别适用于任意形状和尺寸的颗粒散射问题。该方法将连续介质离散为一组电偶极子,通过求解偶极子间的相互作用来获得散射场。
|
20天前
|
GPU红绿阵营对决:CUDA与ROCm内核调度机制深度漫游指南
本文深入剖析GPU内核(Kernel)在CUDA与ROCm异构生态中的底层交互机制,涵盖命令包生成、环形队列投递、Doorbell通知、硬件调度等关键环节;对比NVIDIA的Warp/SIMT与AMD的Wavefront/HSA架构差异;详解内存优化、延迟掩盖、寄存器级通信及Graph静态调度等极限性能调优策略,助工程师穿透抽象,直抵算力本质。(239字)
|
24天前
|
基于YOLOv8的5种玻璃缺陷识别(破裂/打胶/起霜/污染/未加工)(中英文双版) | 附完整源码与效果演示
本文介绍了一种基于YOLOv8的玻璃状况识别系统,该系统能够自动识别玻璃的五种常见缺陷:玻璃破裂、玻璃打胶、玻璃起霜、玻璃污染和玻璃未加工。通过采用先进的深度学习算法,实现了对玻璃产品的高精度、高效率检测,为工业生产提供了可靠的质量保障手段。
|
25天前
|
WSL安装
本文详解WSL2配置Ubuntu(推荐20.04)用于深度学习:启用虚拟化、安装、显卡驱动配置、安全卸载方法;重点解决libcudnn/libcuda软链接失效问题,提供临时修复与永久生效(.bashrc)两种方案;并配置Windows代理、内存/网络等高级选项,兼顾开发与训练需求。
|
26天前
|
基于YOLOv8的脑肿瘤识别(中英文双版) | 附完整源码与效果演示
脑肿瘤是严重威胁人类健康的疾病之一,其早期准确诊断对患者的治疗和预后至关重要。传统的脑肿瘤诊断主要依赖放射科医生的经验,通过CT、MRI等医学影像进行人工判读。然而,这种方法存在主观性强、工作量大、易受疲劳影响等问题。随着深度学习技术的快速发展,基于计算机视觉的医学影像分析为脑肿瘤的自动识别提供了新的解决方案。
|
27天前
|
KV Cache管理架构演进:从连续分配到统一混合内存架构
本文系统梳理KV Cache管理演进的5个时代(从无到统一内存架构),剖析vLLM、SGLang、TensorRT-LLM等框架在各阶段的技术取舍与实践效果,涵盖连续缓存、PagedAttention、异构/分布式/统一混合架构等关键突破,助你为不同场景(文本、多模态、长上下文、混合模型)选择最优方案。
video-subtitle-remover(VSR)--开源AI去字幕方案深度解析
VSR(video-subtitle-remover)是一款开源AI视频去字幕工具,支持本地运行,无需上传数据。它融合STTN、LaMa、ProPainter三大前沿修复模型,可智能检测并擦除硬字幕/水印,保持原分辨率与画质。兼容CUDA/DirectML,适配NVIDIA/AMD/Intel显卡,兼顾隐私性、可控性与高性能。
|
30天前
| |
来自: 视觉智能
视频后期黑科技:深度拆解开源 VSR 架构与视频 Inpainting 实践全指南
本文深度解析视频补全(Video Inpainting)前沿技术,聚焦硬字幕去除工具VSR的底层架构(OCR定位、时序传播、光流对齐)、本地部署要点(CUDA环境、显存优化)及云端方案(550W AI扩散模型),对比二者在隐私、效率与画质上的差异,助力开发者科学选型。(239字)
Target商品详情页前端性能优化实战
Target全渠道零售性能优化方案:聚焦库存智能检查、多层价格并行计算、Drive Up取货推荐、自有品牌故事化展示及药房/照片等服务集成,首屏加载提速62%,库存检查提升76%,转化率+35%,Circle参与度+48%。(239字)
免费试用