Я пытался построить кластер с использованием нескольких компьютеров в течение трех дней и потерпел неудачу. Итак, теперь я собираюсь попытаться втянуть вас в решение моей проблемы за меня. Если все пойдет хорошо, я надеюсь, что мы сможем создать пошаговое руководство, чтобы использовать его в качестве справочного материала, чтобы сделать это в будущем, потому что пока мне не удалось найти подходящую ссылку для настройки этого ( может это слишком специфичная задача?)
В моем случае предположим, что Windows 7 с PuTTY в качестве SSH-клиента, а «localhost» будет выступать в качестве мастера.
Кроме того, давайте предположим, что только два компьютера находятся в одной сети. Я полагаю, что процесс будет достаточно легко обобщаться, так что если я смогу заставить его работать на двух компьютерах, я смогу заставить его работать и на трех. Итак, мы будем работать над localhost
и remote-computer
.
Вот что я собрал до сих пор (со ссылками внизу)
- Установите PuTTY на
localhost
. - Установите PuTTY на
remote-computer
- Установите SSH-сервер на
remote-computer
- Назначить ему порт для прослушивания? (Я не уверен в этом шаге)
- Установите R на
localhost
- Установите ту же версию R на
remote-computer
- Добавьте R в переменную среды PATH как для
localhost
, так и дляremote-computer
. - Запустите приведенный ниже код R из
localhost
код:
library(parallel)
cl <- makePSOCKcluster(c(rep("localhost", 2),
rep("remote-computer", 2)))
До сих пор я сделал шаги 1-3, не уверен, нужно ли мне делать 4, сделал 5-7, и код для шага 8 просто висит на неопределенный срок.
Когда я проверяю журналы своего SSH-сервера, не видно, что я захожу на SSH-сервер с localhost
. Итак, похоже, что моя первая проблема заключается в правильной настройке SSH. Кому-нибудь это удалось, и не могли бы вы поделиться своим опытом?
РЕДАКТИРОВАТЬ К сожалению: ссылки http://www.milanor.net/blog/wp-content/uploads/2013/10/03.FirstStepinParallelComputing.pdf
R Parallel — подключение к удаленным ядрам
https://stat.ethz.ch/pipermail/r-sig-hpc/2010-October/000780.html