opencl

    0热度

    2回答

    我有一个需要在CPU上通过矩阵进行转换的向量列表。我将它们存储为一个动态分配的数组(Eigen :: Vector4f *)。一旦它们被转换,我需要在向量上运行OpenCL内核。我想知道什么最好的方法是将这些数据传递到OpenCL,而不必从Eigen :: Vector - > float数组复制数据,因为这样做会相当昂贵。我的理解是,Eigen将矢量值存储在某种可以访问的缓冲区中?

    2热度

    2回答

    可以说我有一个虽然有支持能力的设备,但目前不支持OpenCL。我有ISA,硬件设计文档和许多其他文档。我设备所在的系统目前拥有C和C++编译器,并且支持许多Linux发行版。 现在我想添加OpenCL(可以说最新版本2.2)支持到我的设备。为了让我的设备得到支持,我实际上需要做些什么?我在他们的网站上看到SPIR-V的文件,即:SPIR-V registry page,opencl extende

    0热度

    2回答

    我将改进OCL内核性能,并且想要阐明内存事务如何工作以及哪种内存访问模式真的更好(以及为什么)。 内核提供了8个整数的向量,这些整数被定义为数组:int v [8],这意味着,在进行任何计算之前,必须将整个向量加载到GPR中。所以,我相信这个代码的瓶颈是初始数据加载。 首先,我考虑一些理论基础知识。 目标硬件是Radeon RX 480/580,具有256位GDDR5存储器总线,突发读/写事务有8

    1热度

    1回答

    OpenCL最佳实践指南(https://www.cs.cmu.edu/afs/cs/academic/class/15668-s11/www/cuda-doc/OpenCL_Best_Practices_Guide.pdf)在3.1.3节中建议使用clFlush以确保命令以正确的顺序发生,例如,处理不数据传输之前发生: 传输的数据队列0 clFlush的队列0 运行内核队列0,传输数据的队列1

    0热度

    1回答

    我试图将一段OpenCL内核代码移植到SideFX Houdini,使用其内部脚本语言调用VEX(代表vector expression)使用 。 但是,我有理解这些索引做什么和他们如何工作的问题。 据我所知,get_global_id()返回索引到一个给定的工作项目的工作(读它的地方),但我真的不明白到底是什么。 (也许与计算机核心有关,我猜?) 如果输入是由x和y中的500像素形成的2D网格,

    0热度

    1回答

    关于arm-cortexA53船舶信息:https://www.arm.com/products/processors/cortex-a; 关于opencl2.2信息:https://www.khronos.org/opencl/ I have huawei nova young really phone, cpu is Arm-cortexA53.Now i want to do some OP

    2热度

    1回答

    我创建一个OpenFX插件的虚拟现实系统做一些图像处理创建从cl_context OpenCL上下文。 由于我们现有的加工代码,插件是为主机,基于OpenCL的,主机开发商给了我一个扩展,OFX共享OpenCL的环境。 但是 - 我们的代码使用C++ API(CL ::上下文),以及他们所提供的扩展给了我一个指针是C cl_context。 有没有办法为我创造一个CL ::上下文从cl_conte

    0热度

    1回答

    下面的代码草稿我公司生产的: void __kernel myKernel(__global const short* input, __global short* output, const int width, const int height){ // Always square. (and 16x16 i

    1热度

    1回答

    我真的是OpenCL的新手。我已经从这个网站获取了示例代码:http://www.drdobbs.com/open-source/easy-opencl-with-python/240162614?pgno=2,我已经对它进行了一些定制。我的目标是向内核发送一个填充1个数字的4x4矩阵,并从内核恢复它。我知道这是一个微不足道的代码,但我需要这样做来了解OpenCL的工作原理。输入矩阵是这一个: [

    0热度

    1回答

    我目前正在学习如何使用OpenCL进行编码,并决定运行一些示例代码。我已下载英特尔SDK,Microsoft Visual Studio 2017及其相关插件。 当我尝试运行某个程序时,出现了与从Intel下载的%iNTELOCLSDKROOT依赖项中包含的其中一个“附加依赖性”文件有关的问题。我尝试构建解决方案时遇到的错误是模板不能声明为具有C链接(C2894)。这个错误完全位于一个名为xtr1