-
-
3我自己编的opencl 1.2程序, 需要把数据传到gpu, 时间消耗非常大 去年听说opencl 2.0 svm多牛b, 统一寻址, 云云, 给我忽悠的. 最近听cuda那边说 统一寻址也需要把数据传到gpu, 只是编程上简化了, 需要等硬件统一寻址(说maxwell有)才行. 并且amd给的opencl2.0例子也是在一个kavari apu上运行的. 那么, 我想知道: 1. amd独立显卡有没有opencl2.0 真正能统一寻址的? 2. amd a10 apu(支持opencl2.0)跑opencl 2.0 svm的程序是不是可以极大的降低数据传输延迟(应该是, 都在内存里再复制一遍我
-
5
-
1我们将kernel函数在不包含openGL的工程单独分析测试得到时间大概在5.5ms,而如果将使用openGL将opencl kernel计算的结果显示到屏幕时,这时profiling出时间为8ms。可能有哪些原因? 会不会是openCL和openGL context相互间切换对kernel运行有影响?比如openGL 在rendering中openCL开始了计算导致效率下降?
-
1各位朋友,有个问题请教下。 自己写了一个图像处理程序用到了OpenCL,现在要做测试,手里几台机器都是NVIDA的显卡。 如果要保证程序的通用性,是不是要把Intel和AMD的显卡也测一遍? 同一个系列的显卡还有很多型号,这个测试的覆盖策略应该怎么定? 请这方面经验的朋友聊一下
-
0问题描述 如题,小弟因为玩老滚5,要使HTD SMP插件生效必须要OpenCL 2.0的支持,但N卡目前只支持到OpenCL 1.2。插件作者对N卡用户的建议是利用核显来实现对OpenCL 2.0的支持。方法就是下载安装英特尔核显的OpenCL 2.0运行库。(opencl_runtime_15.1_x64_setup.msi) 本人机器配置如下: 机型:Terrans Force P770DM-G CPU:I7 6700K 内存:金士顿8G 2133X2 显卡:GTX980M 8G 但问题来了,挨千刀的蓝天居然把这款本本的核显屏蔽了!还是物理屏蔽!折腾了好久都没办法,心疲力竭,没
-
4最近在做个项目,嵌入式平台,每周期要处理50多万个符号,绝大多数为汉字,还有英文、数字、标点等。需要将这些都转成unicode,我采用多线程(omp)处理,需要200ms,而我的目标是50ms,最多100ms,在接触opengl时感觉显卡并行计算能力很强,所以想来问问大牛们,用opencl可以满足我的需求吗?如果可以,我就去学一下opencl,争取2周搞定,如果不行,我也不去走弯路了,找其他方法。
-
1【悬赏10万】寻廉价GPU虚拟化解决方案
-
1如题,有意者可以私聊。我邮箱lirui@ynao.ac.cn
-
21、 GPU实时信息读取(频率、负载、温度等) 2、 GPU高负载压力测试 3、 GPU调频压力测试 4、 GPU多线程运算测试 5、 图层叠加切换测试 请问大神们想要在Adnroid UI层实现如上效果 需要再JNI层封装那些OpenCL提供的方法?或者说哪里能弄到OpenCL。so的源码及接口文档什么的 ?
-
1请问下有用过Altera openCL SDK16.0的没有啊?
-
1新手求教,入门OpenCL有哪些比较好的教程推荐
-
1初学者, 正在看矩阵相乘的代码 __kernel void simpleMultiply(__global float* outPutC, int widthA, int heightA, int widthB , int heightB , __global float* inputA , __global float* inputB ) { int row = get_global_id(1); int col = get_global_id(0); float sum = 0.0f ; for(int i=0;i<widthA; i++) { sum += inputA[row*widthA+i] * inputB[i*widthB+col]; } outPutC[row*widthB+col] = sum; } ; 看到这个kernel函数, 其中 int row = get_global_id(1); int col = get_global_id(0); 这两行不是很理解, 为什么row就是1, col就是0呢? 这个是哪里分配的id呢?
-
5RT, 求助,感谢~~~~
-
2请教高手,如何写含有多个kernel的opencl程序。 写多个kernel的opencl 程序时,是否需要创建多个program对象,每个kernel关联一个program对象,然后按顺序执行? 不过我看到AMD讲义中说,一个program对象中可以包含多个kernel, 执行某个kernel时只需为该kernel 单独创建内核对象即可。可是如何在一个program对象中包含多个kernel呢?求教。 是不是把多个kernel函数都写在一个.cl文件中,或者说把多个kernel都放在一个kernelsource字符串中就可以了呢?
-
1uchar2 a = (5,4); uchar2 b ; b = (a == 5); 那么 b是不是(1,0) ??
-
0本人小白,刚接触OpenCL。电脑win10系统,目前装完Visual Studio 2015。听说VS可以直接调用SDK中的程序,以此来测试VS是否可用。求教各位,知道怎么调用SDK中的程序吗~~
-
1我是一个小白,最近看书的时候想到一个问题,假如我有一个一维数组a[8]={1,2,3,4,5,6,7,8}和一个输出数组b[2],我想在内核中按照下面的方式计算 b[0]=a[0]+a[1]+a[2]+a[3],b[1]=a[4]+a[5]+a[6]+a[7],且输入数据只能是这个一维数组,请问内核人如何编写可以一次读取数组a的四个数据进行上边的运算呢,可以用get_global_id咩?最好能有一个小程序赐教
-
15如图,我不想显卡运行在1000频率,现在想修改,怎么改???例如改成900MHz 注意:这是关于OpenCL的,不是玩游戏的频率,玩游戏的频率驱动自带的就可以改。【图片】
-
6290x和970那个更适合opencl的开发呢?
-
4实验室老电脑的显卡,GPU_Z显示不支持OPENCL ,除了换显卡,有没有别的方法了呢?跑OPENCL的程序就会显示没有发现设备
-
5
-
22看了一段时间的opencl总算有点清晰了这个编程的过程,还是看流程图理解的好些。 这里做下小总结,希望能对初学者有些帮助,如有不正确的地方还请大家
-
1
-
4main.c #define _CRT_SECURE_NO_WARNINGS #define PROGRAM_FILE "matvec.cl" #define KERNEL_FUNC "matvec_mult" #include <s
-
0clGetPlatformIDs(0,NULL,&numPlatforms)运行2000ms,clBuildProgram()运行900ms,其他一切正常,这是为什么?内核都能
-
0如题,有的能不能谈谈性能如何,还有机器配置,谢谢啦
-
0还记得当年问你传结构体到显存的事情,还记得查帖子看到最多的就是你说 这吧里就我一个人。。今天回
-
1OPENCL计算时,GPU占用率长期是100%,有没有办法限制一下,比如最高80%?
-
2altera sdk for opencl 有破解版的吗?必须购买license吗?
-
0如题,在网上都搜不到,现在官网也只有商业版,但我的板子不支持,求求求,非常感谢
-
01.cl_device_work_group_size和cl_kernel_work_group_size怎么区分 2.clEnqueueNDRangeKernel()的第五和第六个参数,globalWorkSize和localWorkSize是
-
0这个吧人气不足啊~我来顶顶 小白一枚,开始学OpenCL不到1月,《OpenCL异构计算》 第四章图片旋转和卷积例程都跑不起来,无语……
-
2
-
4对于那些有上千个流处理器的显卡来说,如果碰到对于golbal存储区的访问,并且 1.不是访问同一个地址; 2.要访问的数据在同一个bank上; 3.没有ddr; 那么难
-
1每一步都用PRINTF。显示在执行clEnqueueNDRangeKernel这一步时,就不动了。永远在这一步了。。。是什么情况??
-
0main.c #include <stdio.h> #include <stdlib.h> #include <string.h> #ifdef MAC #include <OpenCL/cl.h> #else #include &
-
0main.c #include <stdio.h> #include <stdlib.h> #include <string.h> #ifdef MAC #include <OpenCL/cl.h> #else #include &
-
0求助大神, C版本传递local参数知道怎么弄, status = clSetKernelArg(kernel, 1, groupSize * binSize * sizeof(cl_uchar), NULL); C++版本怎么传呢
-
1小女刚学习opencl,刚安装了amd-sdk,还没有装amd显卡驱动,然后运行opencl的例程,打印出如下语句 GPU not found.Falling back to cpu device. 至此