Публикации по теме 'cuda'


Нахождение области синусоидальной волны с помощью cuda.
Как найти область под функцией? Мы берем N то есть никаких шагов от 0 до ›π. На каждом этапе мы найдем среднюю точку полосы, показанной на изображении выше. и найдите площадь этой единственной полосы по следующей формуле. Основы cuda c Графический процессор nVIdia называется устройством , а процессор, из которого вызывается код, называется хостом. для запуска кода на устройстве нам необходимо перенести / скопировать наши данные / переменные в память графического..

Примеры CUDA от Numba
Прочитайте часть 3 этой серии, чтобы узнать о потоках и событиях в программировании CUDA для Python. Часть 3 из 4: трансляции и события Введение В первых двух частях этой серии ( Часть 1 здесь и Часть 2 здесь ) мы узнали, как выполнять простые задачи с помощью программирования на GPU, такие как неловко параллельные задачи, сокращения с использованием общей памяти и функции устройства. Мы также узнали, как синхронизировать функции с хоста — и почему это может быть не лучший способ..

Настройка среды Tensorflow с CUDA, поддержка графического процессора для графического процессора NVIDIA
Создайте среду conda и активируйте среду: Ref — https://conda.io/projects/conda/en/latest/user-guide/getting-started.html#managing-environments 2. Перейдите на эту страницу и найдите, какая последняя версия tensorflow поддерживается GPU и CUDA — https://www.tensorflow.org/install/source#gpu , и установите эту конкретную версию тензорный поток: pip установить tensorflow==2.9.0 3. Перейдите на developer.nvidia.com/cuda-toolkit-archive , загрузите соответствующую версию набора..

В двух словах Contradistinguisher для неконтролируемой адаптации домена (CUDA)
Модель, которая имеет дело с определенными недостатками выравнивания домена, задействованными в различных методах адаптации домена, наряду с получением результатов на уровне техники. Как мы знаем, в мире глубокого обучения у нас может не быть достаточно контролируемых данных для обучения нашей модели. Так что адаптация домена - очень полезная тема для поиска. Недавно я прочитал Документ ICDM’19« Контрастное различие для неконтролируемой адаптации домена », в котором предлагался прямой..

Вопросы по теме 'cuda'

Ошибка компиляции Thrust (библиотека CUDA), например, 'vectorize_from_shared_kernel__entry': не является членом 'thrust::detail::device::cuda'
Я создаю проект VS с помощью CUDA VS Wizard и пытаюсь собрать программу cuda с помощью Thrust, тестовая программа довольно проста: // ignore headers int main(void) { thrust::device_vector<double> X; X.resize(100); } Я получу ошибку...
1267 просмотров
schedule 12.01.2024

Использование шаблонов или макросов C++ для генерации функций времени компиляции
У меня есть код, который работает во встроенной системе, и он должен работать очень быстро. Я знаю C и макросы, и этот конкретный проект написан в основном на C, но он также использует шаблоны C++ [все чаще]. Есть встроенная функция: inline my_t...
1967 просмотров
schedule 04.11.2022

Ошибка новичка в CUDA
Я пишу небольшую программу в CUDA, и у меня есть следующие ошибки: contraste.cu(167): error: calling a host function from a __device__/__global__ function is not allowed Я не понимаю, почему. Не могли бы вы помочь мне и показать мне мои...
1182 просмотров
schedule 18.10.2022

Сколько «ядер CUDA» имеет каждый мультипроцессор графического процессора?
Я знаю, что устройства до архитектуры Fermi имели 8 SP в одном мультипроцессоре. Счет такой же в архитектуре Ферми?
9962 просмотров
schedule 15.03.2024

CUDA — Реализация хеш-карты устройства?
Есть ли у кого-нибудь опыт реализации хеш-карты на устройстве CUDA? В частности, мне интересно, как можно выделить память на устройстве и скопировать результат обратно на хост, или есть ли какие-либо полезные библиотеки, которые могут облегчить эту...
5472 просмотров
schedule 04.08.2022

Как скомпилировать программу CUDA Toolkit 4.0 RC2 под VS2010 или VS2008?
Я полный новичок в CUDA и пытаюсь понять, как написать и скомпилировать тестовую программу CUDA с помощью Visual Studio. У меня установлен набор инструментов CUDA 4 и установлены версии Visual Studio 2008 и 2010 годов. Я читал, что начиная с CUDA...
2332 просмотров

Решение матриц с помощью C (в рамках CUDA)
В рамках более крупной проблемы мне нужно решить небольшие линейные системы (т.е. NxN, где N ~ 10), поэтому использование соответствующих библиотек cuda не имеет смысла с точки зрения скорости. К сожалению, также неясно, как решить такие системы,...
1977 просмотров
schedule 01.02.2024

Как программно получить характеристики карты в CUDA
Я только начинаю с CUDA. Есть ли способ получить характеристики карты программно?
10551 просмотров
schedule 05.01.2024

cudaMemcpy2D для копий в разделяемой памяти
У меня есть некоторая память, выделенная на устройстве, которая представляет собой всего лишь один malloc размером H * W * sizeof (float). Это должно представлять матрицу H * W. У меня есть код, в котором мне нужно поменять местами квадранты...
642 просмотров
schedule 16.05.2024

cuda недопустимый дескриптор ресурса
Что означает эта ошибка? Я не могу найти НИКАКОЙ информации о нем. Это происходит в cudaEventRecord. в заголовочном файле проекта: cudaEvent_t cudaEventStart; в файле .c: cudaEventCreate(&cudaEventStart); printf("create event:...
12515 просмотров
schedule 13.10.2022

Программа CUDA вызывает сбой драйвера nvidia
Моя программа CUDA для расчета Монте-Карло Пи вызывает сбой моего драйвера nvidia, когда я превышаю около 500 испытаний и 256 полных блоков. Кажется, это происходит в функции ядра monteCarlo. Любая помощь приветствуется. #include <stdio.h>...
8383 просмотров
schedule 05.11.2022

Умножение матриц CUDA / C
Может кто-нибудь сказать мне, что я здесь делаю не так? Я пытаюсь создать программу, которая возвращает матрицу в степень с помощью cuda. Кажется, что cudaMemcpy (ln103) не возвращает массив результатов. Я проверяю это, возвращая первый элемент в...
1493 просмотров
schedule 25.02.2024

Разница между cuda.h, cuda_runtime.h, cuda_runtime_api.h
Я начинаю программировать на CUDA и в некоторых примерах нахожу включаемые файлы cuda.h , cuda_runtime.h и cuda_runtime_api.h , включенные в код. Может кто-нибудь объяснить мне разницу между этими файлами?
23561 просмотров
schedule 28.06.2022

PyOpenCL не может найти включаемые файлы при установке через easy_install.
поэтому я загрузил библиотеки nVidia CUDA и поместил их в папку по умолчанию: /usr/local/cuda Когда я запускаю это: sudo easy_install pyopencl Это дает мне эту ошибку: In file included from src/wrapper/wrap_cl.cpp:1:0:...
4596 просмотров
schedule 05.07.2022

CUDA, cuPrintf вызывает неуказанный сбой запуска?
У меня есть ядро, которое запускается дважды с разным размером сетки. Моя проблема связана с cuPrintf. Когда у меня нет cudaPrintfInit() до запуска ядра и cudaPrintfDisplay(stdout, true) и cudaPrintfEnd() после запуска ядра, у меня нет...
1336 просмотров
schedule 29.04.2024

Cuda 4.0 с ошибкой компилятора Visual Studio 2010 cl
Поскольку я не получил никакой помощи на форумах Nvidia (см. мой пост внизу ветки), и, кажется, я не единственный, кто борется с подобными проблемами, я попробую здесь. Я пытался скомпилировать примеры Cuda SDK 4.0, а также следовать очень...
1065 просмотров
schedule 08.12.2023

Добавление DLL CUDA в качестве ссылки на проект C#, показывающий ошибку
Я сделал простую CUDA dll код, который я показываю ниже. Функция добавляет некоторое значение в массив. #include<stdio.h> #include<stdlib.h> #include<cuda.h> //Cuda Kernel __global__ void add_gpu(float *a) { int...
926 просмотров
schedule 15.01.2024

Реализация хеш-таблицы для GPU [закрыта]
Я ищу реализацию хеш-таблицы, которую я могу использовать для кодирования CUDA. есть ли хорошие там. Что-то вроде словаря Python. Я буду использовать строки в качестве ключей
9382 просмотров
schedule 20.10.2022

Пример cuda sdk bandwidthTest - сбой сборки
Я пытаюсь создать bandwidthTest_vs2010 из cuda sdk, но получаю сообщение об ошибке: 1> LINK: фатальная ошибка LNK1104: не удается открыть файл shrUtils32D.lib Дополнительные каталоги библиотеки содержат: $ (CudaToolkitLibDir)...
2229 просмотров
schedule 21.12.2023

В чем разница между PTX и CUBIN w.r.t. компилятор NVCC?
У меня установлен CUDA 4.0 и устройство с Compute Capability 2.0 (карта GTX 460). В чем разница между файлом «cubin» и файлом «ptx»? Я думаю, что cubin — это собственный код для графического процессора, поэтому он зависит от микроархитектуры, а...
12346 просмотров
schedule 08.10.2022