Можно ли создать RDD, используя данные мастера или работника? Я знаю, что есть опция SC.textFile()
, которая получает данные из локальной системы (драйвера). Точно так же мы можем использовать что-то вроде «master:file://input.txt
»? потому что я получаю доступ к удаленному кластеру, а размер моих входных данных велик и я не могу войти в удаленный кластер.
Я не ищу S3
или HDFS
. Пожалуйста, предложите, если есть какой-либо другой вариант.