Публикации по теме 'cuda'
Нахождение области синусоидальной волны с помощью cuda.
Как найти область под функцией?
Мы берем N то есть никаких шагов от 0 до ›π. На каждом этапе мы найдем среднюю точку полосы, показанной на изображении выше. и найдите площадь этой единственной полосы по следующей формуле.
Основы cuda c
Графический процессор nVIdia называется устройством , а процессор, из которого вызывается код, называется хостом. для запуска кода на устройстве нам необходимо перенести / скопировать наши данные / переменные в память графического..
Примеры CUDA от Numba
Прочитайте часть 3 этой серии, чтобы узнать о потоках и событиях в программировании CUDA для Python.
Часть 3 из 4: трансляции и события
Введение
В первых двух частях этой серии ( Часть 1 здесь и Часть 2 здесь ) мы узнали, как выполнять простые задачи с помощью программирования на GPU, такие как неловко параллельные задачи, сокращения с использованием общей памяти и функции устройства. Мы также узнали, как синхронизировать функции с хоста — и почему это может быть не лучший способ..
Настройка среды Tensorflow с CUDA, поддержка графического процессора для графического процессора NVIDIA
Создайте среду conda и активируйте среду: Ref — https://conda.io/projects/conda/en/latest/user-guide/getting-started.html#managing-environments
2. Перейдите на эту страницу и найдите, какая последняя версия tensorflow поддерживается GPU и CUDA — https://www.tensorflow.org/install/source#gpu , и установите эту конкретную версию тензорный поток:
pip установить tensorflow==2.9.0
3. Перейдите на developer.nvidia.com/cuda-toolkit-archive , загрузите соответствующую версию набора..
В двух словах Contradistinguisher для неконтролируемой адаптации домена (CUDA)
Модель, которая имеет дело с определенными недостатками выравнивания домена, задействованными в различных методах адаптации домена, наряду с получением результатов на уровне техники.
Как мы знаем, в мире глубокого обучения у нас может не быть достаточно контролируемых данных для обучения нашей модели. Так что адаптация домена - очень полезная тема для поиска. Недавно я прочитал Документ ICDM’19« Контрастное различие для неконтролируемой адаптации домена », в котором предлагался прямой..
Вопросы по теме 'cuda'
Ошибка компиляции Thrust (библиотека CUDA), например, 'vectorize_from_shared_kernel__entry': не является членом 'thrust::detail::device::cuda'
Я создаю проект VS с помощью CUDA VS Wizard и пытаюсь собрать программу cuda с помощью Thrust, тестовая программа довольно проста:
// ignore headers
int main(void)
{
thrust::device_vector<double> X;
X.resize(100);
}
Я получу ошибку...
1267 просмотров
schedule
12.01.2024
Использование шаблонов или макросов C++ для генерации функций времени компиляции
У меня есть код, который работает во встроенной системе, и он должен работать очень быстро. Я знаю C и макросы, и этот конкретный проект написан в основном на C, но он также использует шаблоны C++ [все чаще]. Есть встроенная функция:
inline my_t...
1967 просмотров
schedule
04.11.2022
Ошибка новичка в CUDA
Я пишу небольшую программу в CUDA, и у меня есть следующие ошибки:
contraste.cu(167): error: calling a host function from a __device__/__global__ function is not allowed
Я не понимаю, почему. Не могли бы вы помочь мне и показать мне мои...
1182 просмотров
schedule
18.10.2022
Сколько «ядер CUDA» имеет каждый мультипроцессор графического процессора?
Я знаю, что устройства до архитектуры Fermi имели 8 SP в одном мультипроцессоре. Счет такой же в архитектуре Ферми?
9962 просмотров
schedule
15.03.2024
CUDA — Реализация хеш-карты устройства?
Есть ли у кого-нибудь опыт реализации хеш-карты на устройстве CUDA? В частности, мне интересно, как можно выделить память на устройстве и скопировать результат обратно на хост, или есть ли какие-либо полезные библиотеки, которые могут облегчить эту...
5472 просмотров
schedule
04.08.2022
Как скомпилировать программу CUDA Toolkit 4.0 RC2 под VS2010 или VS2008?
Я полный новичок в CUDA и пытаюсь понять, как написать и скомпилировать тестовую программу CUDA с помощью Visual Studio.
У меня установлен набор инструментов CUDA 4 и установлены версии Visual Studio 2008 и 2010 годов. Я читал, что начиная с CUDA...
2332 просмотров
schedule
22.02.2024
Решение матриц с помощью C (в рамках CUDA)
В рамках более крупной проблемы мне нужно решить небольшие линейные системы (т.е. NxN, где N ~ 10), поэтому использование соответствующих библиотек cuda не имеет смысла с точки зрения скорости.
К сожалению, также неясно, как решить такие системы,...
1977 просмотров
schedule
01.02.2024
Как программно получить характеристики карты в CUDA
Я только начинаю с CUDA. Есть ли способ получить характеристики карты программно?
10551 просмотров
schedule
05.01.2024
cudaMemcpy2D для копий в разделяемой памяти
У меня есть некоторая память, выделенная на устройстве, которая представляет собой всего лишь один malloc размером H * W * sizeof (float).
Это должно представлять матрицу H * W.
У меня есть код, в котором мне нужно поменять местами квадранты...
642 просмотров
schedule
16.05.2024
cuda недопустимый дескриптор ресурса
Что означает эта ошибка? Я не могу найти НИКАКОЙ информации о нем. Это происходит в cudaEventRecord.
в заголовочном файле проекта:
cudaEvent_t cudaEventStart;
в файле .c:
cudaEventCreate(&cudaEventStart);
printf("create event:...
12515 просмотров
schedule
13.10.2022
Программа CUDA вызывает сбой драйвера nvidia
Моя программа CUDA для расчета Монте-Карло Пи вызывает сбой моего драйвера nvidia, когда я превышаю около 500 испытаний и 256 полных блоков. Кажется, это происходит в функции ядра monteCarlo. Любая помощь приветствуется.
#include <stdio.h>...
8383 просмотров
schedule
05.11.2022
Умножение матриц CUDA / C
Может кто-нибудь сказать мне, что я здесь делаю не так? Я пытаюсь создать программу, которая возвращает матрицу в степень с помощью cuda. Кажется, что cudaMemcpy (ln103) не возвращает массив результатов. Я проверяю это, возвращая первый элемент в...
1493 просмотров
schedule
25.02.2024
Разница между cuda.h, cuda_runtime.h, cuda_runtime_api.h
Я начинаю программировать на CUDA и в некоторых примерах нахожу включаемые файлы cuda.h , cuda_runtime.h и cuda_runtime_api.h , включенные в код. Может кто-нибудь объяснить мне разницу между этими файлами?
23561 просмотров
schedule
28.06.2022
PyOpenCL не может найти включаемые файлы при установке через easy_install.
поэтому я загрузил библиотеки nVidia CUDA и поместил их в папку по умолчанию:
/usr/local/cuda
Когда я запускаю это:
sudo easy_install pyopencl
Это дает мне эту ошибку:
In file included from src/wrapper/wrap_cl.cpp:1:0:...
4596 просмотров
schedule
05.07.2022
CUDA, cuPrintf вызывает неуказанный сбой запуска?
У меня есть ядро, которое запускается дважды с разным размером сетки.
Моя проблема связана с cuPrintf. Когда у меня нет cudaPrintfInit() до запуска ядра и cudaPrintfDisplay(stdout, true) и cudaPrintfEnd() после запуска ядра, у меня нет...
1336 просмотров
schedule
29.04.2024
Cuda 4.0 с ошибкой компилятора Visual Studio 2010 cl
Поскольку я не получил никакой помощи на форумах Nvidia (см. мой пост внизу ветки), и, кажется, я не единственный, кто борется с подобными проблемами, я попробую здесь.
Я пытался скомпилировать примеры Cuda SDK 4.0, а также следовать очень...
1065 просмотров
schedule
08.12.2023
Добавление DLL CUDA в качестве ссылки на проект C#, показывающий ошибку
Я сделал простую CUDA dll код, который я показываю ниже. Функция добавляет некоторое значение в массив.
#include<stdio.h>
#include<stdlib.h>
#include<cuda.h>
//Cuda Kernel
__global__ void add_gpu(float *a)
{
int...
926 просмотров
schedule
15.01.2024
Реализация хеш-таблицы для GPU [закрыта]
Я ищу реализацию хеш-таблицы, которую я могу использовать для кодирования CUDA. есть ли хорошие там. Что-то вроде словаря Python. Я буду использовать строки в качестве ключей
9382 просмотров
schedule
20.10.2022
Пример cuda sdk bandwidthTest - сбой сборки
Я пытаюсь создать bandwidthTest_vs2010 из cuda sdk, но получаю сообщение об ошибке: 1> LINK: фатальная ошибка LNK1104: не удается открыть файл shrUtils32D.lib
Дополнительные каталоги библиотеки содержат:
$ (CudaToolkitLibDir)...
2229 просмотров
schedule
21.12.2023
В чем разница между PTX и CUBIN w.r.t. компилятор NVCC?
У меня установлен CUDA 4.0 и устройство с Compute Capability 2.0 (карта GTX 460).
В чем разница между файлом «cubin» и файлом «ptx»?
Я думаю, что cubin — это собственный код для графического процессора, поэтому он зависит от микроархитектуры, а...
12346 просмотров
schedule
08.10.2022