《OpenACC并行程序设计:性能优化实践指南》一 3.3 激光驱动电子束的粒子单元模拟

简介: 本节书摘来自华章出版社《OpenACC并行程序设计:性能优化实践指南》一 书中的第3章,第3.3节,作者:[美] 罗布·法伯(Rob Farber),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.3 激光驱动电子束的粒子单元模拟

粒子单元代码通过将模拟域划分为网格(单元格)来模拟粒子在电磁场中的运动,同时保持粒子作为自由运动的实体。本章用于性能研究的示例模拟了如何将非常高能量的激光脉冲射入氢气中,并且在其尾流场中加速以产生几乎以光速传播的电子束,并且不需要相当大的常规粒子加速器来加速电子束。
图3-3展示了实际模拟通过离散时间步长的过程,其中每一步涉及四个阶段。首先计算所有粒子在电场(E)和磁场(B)作用下的洛伦兹力(F)。接下来,粒子沿着洛伦兹力方向移动。这些移动的带电粒子产生电流(J),计算产生的电流大小。最后,产生的电流会影响原有电场和磁场,每次开始前都需要重新计算电场和磁场。选择合适的模拟时间步长的持续时间,使得在一个时间步长内粒子移动的距离不超过一个单元大小。

screenshot

PCIonGPU源于一个高中生在HZDR实习期间的概念证明。它是单个GPU CUDA实现,比任何其他PCI代码都要快。从那时起,人们将这个应用移植到多GPU上,并且代码从CUDA C变成了C++ 11。使用本章之前讲述的优化步骤,程序总性能得到进一步提升。PIConGPU功能已经封装成库,可供其他应用调用,使得其他粒子网格模拟的开发者从中受益。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
10月前
如何用晶体管构建异或门
。XOR ,异或的缩写,它是一种逻辑运算,当高电平输入的数量为奇数时,产生高电平输出;当低电平输入的数量为偶数时,产生低电平输出。这种独特的特性使异或门成为各种应用中的重要组成部分,从简单的二进制算术到复杂的数据加密算法。 在本文中,我们将探讨异或门的内部工作原理,包括其真值表、逻辑符号表示、电路图以及使用晶体管的实际构造。
546 0
路径损耗计算模型 | 带你读《大规模天线波束赋形技术原理与设计 》之二十五
本小节介绍 3D 信道的路损模型,是以 ITU 信道为基础拓展得到的。
11693 0
路径损耗计算模型  | 带你读《大规模天线波束赋形技术原理与设计 》之二十五
|
存储 监控 Android开发
嵌入式软件组件经典架构与存储器分类
嵌入式软件组件经典架构与存储器分类
200 0
嵌入式软件组件经典架构与存储器分类
|
存储 传感器
高效学习传感器|浅谈CCD的工作原理以及常用波
高效学习传感器|浅谈CCD的工作原理以及常用波
664 0
高效学习传感器|浅谈CCD的工作原理以及常用波
|
设计模式 负载均衡 并行计算
|
存储 缓存 并行计算
并行视角下的硬件习性
大多数人根据直觉就知道,在系统间传递消息要比在单个系统上执行简单计算更加耗时。不过,在共享同一块内存的系统的线程间传递消息是不是也更加耗时,这点可就不一定了。本章主要关注共享内存系统中的同步和通信的开销,只涉及了一些共享内存并行硬件设计的皮毛,想了解更多信息的读者,可以翻看Hennessy和Patterson的经典教材最新版[HP95]。
125 0
并行视角下的硬件习性
|
资源调度 算法 5G
系统仿真参数 | 带你读《5G非正交多址技术》之六
系统仿真参数设置包含三大块,第一块是仿真的场景及小区的拓扑结构; 第二块是业务模型;第三块是具体参数的配置。
系统仿真参数 | 带你读《5G非正交多址技术》之六
|
算法 5G
仿真评估方法 | 带你读《5G非正交多址技术》之五
下行非正交传输的仿真评估包括链路级仿真和系统级仿真。与其他技术不 同,非正交传输的链路仿真一般需要多用户,来精确刻画多用户之间的干扰。 尽管下行传输时,发给远端和近端用户的信号经历同一个信道,但这个信道是 有小尺度衰落的,即本次传输和下次传输的信道增益可能有变化,信噪比不一 样,从而影响接收机消除干扰的能力。当然,评价非正交传输的全面性能分析 需要依靠系统仿真。
仿真评估方法  | 带你读《5G非正交多址技术》之五
|
5G 调度
波形设计 |带你读《5G空口特性与关键技术》之四
峰均功率比(PAPR,Peak to Average Power Ratio)是发射机峰值功率和均值功率的比,它由所采用的信号波形决定,对于发射机的能耗影响很大,是发射波形的一项重要指标。峰均功率比越低,对于提高发射机的效率越有好处。这一指标对于上行终端侧具有尤其重要的意义。
波形设计 |带你读《5G空口特性与关键技术》之四
场景建模 | 带你读《大规模天线波束赋形技术原理与设计 》之二十一
本节讲述了3D 信道场景 、 UMa 场景和 UMi 场景 和 Indoor Office 场景 。
 场景建模   | 带你读《大规模天线波束赋形技术原理与设计 》之二十一