GPGPU OpenCL使用结构体数据

简介: OpenCL编程中可以使用结构体,只需要在核函数kernel中提供同样的结构体申明就可以啦。  如果在主函数中定义了结构体: 1 typedef struct studentNode{ 2 int age; 3 float height; 4 }student; ...

OpenCL编程中可以使用结构体,只需要在核函数kernel中提供同样的结构体申明就可以啦。

 如果在主函数中定义了结构体:

1 typedef struct studentNode{
2     int age;
3     float height;
4 }student;

 主函数中定义数据,并传输给OpenCL kernel:

 1     student *stu_input=(student*)malloc(sizeof(studentNode));
 2     stu_input->age=25;
 3     stu_input->height=1.8l;
 4     student *stu_output=(student*)malloc(sizeof(studentNode));
 5 
 6     cl_mem inputBuffer = clCreateBuffer(context, CL_MEM_READ_ONLY|CL_MEM_COPY_HOST_PTR, sizeof(studentNode),(void *)stu_input, NULL);
 7     cl_mem outputBuffer = clCreateBuffer(context, CL_MEM_WRITE_ONLY ,sizeof(studentNode), NULL, NULL);
 8 
 9     cl_kernel kernel = clCreateKernel(program,"structTest", NULL);
10 
11     status = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *)&inputBuffer);
12     status = clSetKernelArg(kernel, 1, sizeof(cl_mem), (void *)&outputBuffer);

下面是具体的OpenCL kernel,可以对学生的年龄、身高进行修改:

 1 typedef struct studentNode{
 2     int age;
 3     float height;
 4 }student;
 5 
 6 int growUp(__global student *stu_input ,__global student *stu_output)
 7 {
 8     stu_output->age=stu_input->age+1;
 9     stu_output->height=stu_input->height + 0.1;
10     return 0;
11 }
12 
13 __kernel void structTest(__global student *stu_input ,__global student *stu_output)
14 {
15     growUp(stu_input,stu_output);
16 }

执行输出:

注意:

  OpenCL中不支持字符串,如char string[32]="Hello World"。OpenCL不能确定字符串中有多少个有效字符,必须给定字符数量。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
存储 缓存 算法
HLS介绍 - 01 - FPGA的架构、结构以及硬件设计相关概念(二)
HLS介绍 - 01 - FPGA的架构、结构以及硬件设计相关概念
516 0
HLS介绍 - 01 - FPGA的架构、结构以及硬件设计相关概念(二)
|
2月前
|
存储 并行计算 算法
CUDA统一内存:简化GPU编程的内存管理
在GPU编程中,内存管理是关键挑战之一。NVIDIA CUDA 6.0引入了统一内存,简化了CPU与GPU之间的数据传输。统一内存允许在单个地址空间内分配可被两者访问的内存,自动迁移数据,从而简化内存管理、提高性能并增强代码可扩展性。本文将详细介绍统一内存的工作原理、优势及其使用方法,帮助开发者更高效地开发CUDA应用程序。
|
存储 缓存 算法
HLS介绍 - 01 - FPGA的架构、结构以及硬件设计相关概念(一)
HLS介绍 - 01 - FPGA的架构、结构以及硬件设计相关概念
587 0
HLS介绍 - 01 - FPGA的架构、结构以及硬件设计相关概念(一)
|
存储 缓存 安全
平头哥 CPU 编程模型、指令集|学习笔记
快速学习平头哥 CPU 编程模型、指令集
1402 0
平头哥 CPU 编程模型、指令集|学习笔记
|
算法 openCL 异构计算
AMD力挺OpenCL 用GPU打造通用计算神话
本文讲的是AMD力挺OpenCL 用GPU打造通用计算神话,日前,中国高性能计算年会在长沙召开,展会公布了2009年最新的中国TOP 100,国防科技大学研制的天河一号超级计算机以1 PFlops(千万亿次)的计算速度夺得了中国超算排行榜的第一名。
1793 0
|
人工智能 并行计算 Ubuntu
英伟达正式宣布开源 GPU 内核模块代码
近日,英伟达(NVIDIA)宣布,将 Linux GPU 内核模块作为开放源代码发布。早在几天前,NVIDIA 开始在 GitHub 上陆续公开相关代码,目前该项目已经收获 7.7k star,众多网友对本次开源纷纷表示难以置信。
373 0
英伟达正式宣布开源 GPU 内核模块代码
|
缓存 并行计算 API
多种CUDA存储单元详解CUDA中的存储单元种类
多种CUDA存储单元详解CUDA中的存储单元种类
315 0
|
存储 定位技术 芯片
APU、CPU、GPU、SoC傻傻分不清楚?
APU、CPU、GPU、SoC傻傻分不清楚?
1421 0
APU、CPU、GPU、SoC傻傻分不清楚?
|
并行计算 异构计算 编译器