Публикации по теме 'opencl'


Программирование с ускорением на GPU с Amplifier
Стремление создать сложный ИИ или сложный алгоритм для решения проблемы требует более быстрого выполнения кода. В течение многих лет графические процессоры обеспечивали отображение изображений и движения на компьютерных дисплеях, но технически они способны на большее. Графические процессоры вступают в игру, когда для выполнения одной задачи требуются массивные вычисления. GPGPU (вычисления общего назначения на графических процессорах) в настоящее время является одной из горячих тем,..

Вопросы по теме 'opencl'

OpenCL для Python
Я ищу хорошую оболочку\библиотеку OpenCL для Python с хорошей документацией. Я пытался найти несколько... но не смог найти достаточно хорошего.
14606 просмотров
schedule 28.01.2024

Не удается инициализировать использование двойного (fp64) в программах OpenCL
когда я использую следующую строку в своих программах OpenCL #pragma OPENCL EXTENSION cl_khr_fp64 : enable Я получаю следующую ошибку OpenCL: cl::Error: -46, (std::exception.what() returns "clCreateKernel") Кто-нибудь знает, почему?...
1458 просмотров
schedule 08.09.2022

Как объявить функцию внутри функции ядра в OpenCL?
Я хочу определить функцию внутри функции ядра, чтобы сделать мой код индексации более понятным: kernel void do_something (const int some_offset, const int other_offset, global float* buffer) {...
1857 просмотров
schedule 10.07.2022

PyOpenCL не может найти включаемые файлы при установке через easy_install.
поэтому я загрузил библиотеки nVidia CUDA и поместил их в папку по умолчанию: /usr/local/cuda Когда я запускаю это: sudo easy_install pyopencl Это дает мне эту ошибку: In file included from src/wrapper/wrap_cl.cpp:1:0:...
4596 просмотров
schedule 05.07.2022

Расширения OpenCL в Cloo
Я пытаюсь использовать расширение двойной точности в своем ядре OpenCL, но оно не собирается. (Cloo.BuildProgramFailureComputeException) Вот мой код: string kernel = @" #pragma OPENCL EXTENSION cl_khr_fp64 : enable kernel void ImgWarp(...
563 просмотров
schedule 03.02.2024

OpenCL enqueueNDRangeKernel вызывает ошибку нарушения прав доступа
Я постоянно получаю ошибку нарушения прав доступа со всеми моими ядрами, которые я пытаюсь собрать. Другие ядра, которые я беру из книг, работают нормально. https://github.com/ssarangi/VideoCL — здесь находится код. Кажется, чего-то в этом не...
2115 просмотров
schedule 28.02.2024

Открыть время выполнения CL clEnqueueReadBuffer
Я пишу open cl flocking, и у меня странная проблема. Перед выполнением ядра clEnqueueReadBuffer читал из памяти gpu в массив памяти программы 20000 с плавающей запятой без проблем, очень быстро, но после выполнения ядра, которое выполнило какую-то...
580 просмотров
schedule 18.02.2024

Чтение неправильных данных на OpenCL
Я столкнулся с проблемой, что ядро ​​иногда записывает данные не туда или хост неправильно считывает данные. Я пишу одни и те же данные (индекс, по которому я пишу данные) в два глобальных массива с разными типами. Для обеспечения корректности...
884 просмотров
schedule 15.10.2022

Случайные числа с OpenCL с использованием Random123
Я просматривал эту библиотеку Random123 и связанную с ней цитату. : Один загадочный человек подошел к моему стенду и спросил, что я знаю о генерации случайных чисел с помощью OpenCL. Я рассказал ему о реализации Mersenne Twister, но он не...
2755 просмотров
schedule 01.10.2022

Текстура OpenGL для OpenCL в Python
Я хочу передать текстуру OpenGL в OpenCL в Python. Поэтому я создаю текстуру в OpenGL с помощью фреймбуфера: fbo =glGenFramebuffersEXT(1)) glBindFramebufferEXT(GL_FRAMEBUFFER_EXT, fbo) depthbuffer =...
708 просмотров
schedule 26.08.2022

как оптимизировать умножение матриц с помощью OpenACC?
Я изучаю OpenACC (с компилятором PGI) и пытаюсь оптимизировать пример умножения матриц. Самая быстрая реализация, которую я придумал, следующая: void matrix_mul(float *restrict r, float *a, float *b, int N, int accelerate){ #pragma acc data...
3655 просмотров
schedule 10.03.2024

Пошаговая отладка приложений OpenCL GPU под Windows с помощью NVidia GPU
Я хотел бы знать, знаете ли вы какой-либо способ пошаговой отладки ядра OpenCL с использованием Windows (моя IDE - Visual Studio) и запуска ядер OpenCL на графическом процессоре NVidia. Что я нашел до сих пор: с NVidias NSight вы можете только...
2280 просмотров
schedule 01.08.2022

ошибка сегментации (сброс ядра) в opencl
Я очень новичок в OpenCL, но занимаюсь параллельным программированием уже больше года. Я делал свой первый код openCL (умножение матриц). Я написал следующий код, //#include<stdio.h> #include <stdio.h> #include <stdlib.h>...
7243 просмотров
schedule 06.12.2023

повышение параллельного сокращения OpenCL
У меня есть алгоритм, выполняющий двухэтапное параллельное сокращение на графическом процессоре, чтобы найти наименьший элемент в строке. Я знаю, что есть подсказка, как заставить его работать быстрее, но я не знаю, что это такое. Любые идеи о том,...
529 просмотров
schedule 02.02.2024

Библиотека с открытым исходным кодом для сложных математических задач, таких как Matrix Mul, LU, FFT и т. д. в OpenCL
Использование графического процессора в общих целях сейчас является обычным явлением. И самая основная вещь, умножение матриц — первая в учебниках по OpenCL. Вместо того, чтобы писать коды и коды ядра для конкретного GPU. Можно ли вызвать их из...
864 просмотров

Cuda - ЦП OpenCL в 4 раза быстрее, чем версия OpenCL или CUDA GPU
Симулятор волн, над которым я работал с C # + Cudafy ( C # -> CUDA или переводчик OpenCL ), отлично работает, за исключением того факта, что версия процессора OpenCL (драйвер Intel, MacBook Pro 15 дюймов) Retina i7 2,7 ГГц, GeForce 650M (Kepler, 384...
3748 просмотров
schedule 16.12.2023

Реализация OpenCL FFT - бессмысленные выходные данные - предположительно правильный алгоритм
У меня возникли проблемы с модулем взаимной корреляции сигналов БПФ, который я создаю (использует теорему о круговой свертке и т. д. и т. д.). Я хотел бы просто подтвердить, что следующая схема гарантирует, что определенные уровни рекурсии вычисления...
849 просмотров
schedule 03.05.2024

Что я могу использовать для разработки на FPGA (Virtex): C, C++, OpenCL, MPI?
Что можно использовать для разработки на FPGA Virtex-5 или Virtex-7: C, C++, C++11, OpenCL, MPI? И что в основном обычно используется для этого? Есть: SystemC — это набор классов и макросов C++, которые обеспечивают интерфейс моделирования,...
866 просмотров
schedule 25.09.2022

Как разрешить OpenCl видеть устройства Intel и nvidia?
Интересно, как мы можем заставить OpenCl "видеть" мой K20. Xeon и Xeon Phi одновременно? Особенно меня смущает использование здесь двух библиотек (от NVidia и Intel). Как это сделать, если вообще возможно?
3910 просмотров
schedule 15.07.2022

Hough Transform: повышение эффективности алгоритма по сравнению с OpenCL
Я пытаюсь обнаружить круг в двоичном изображении, используя преобразование hough. Когда я использую встроенную функцию Opencv для кругового преобразования, все в порядке, и я могу найти круг. Теперь я пытаюсь написать свой собственный код «ядра»...
1387 просмотров
schedule 15.11.2022