У меня есть ядро, которое запускается дважды с разным размером сетки.
Моя проблема связана с cuPrintf. Когда у меня нет cudaPrintfInit() до запуска ядра и cudaPrintfDisplay(stdout, true) и cudaPrintfEnd() после запуска ядра, у меня нет ошибки, но когда я помещаю их туда, я получаю сообщение об ошибке «неопределенный сбой запуска».
В моем коде устройства есть только один такой цикл для печати:
if (threadIdx.x==0) {
cuPrintf("MAX:%f x:%d y:%d\n", maxVal, blockIdx.x, blockIdx.y);
}
Я использую CUDA 4.0 с картой с возможностью cuda 2.0, поэтому я компилирую свой код с таким синтаксисом:
nvcc LB2.0.cu -arch=compute_20 -code=sm_20