Теперь у меня в RDD более 300 столбцов, но я обнаружил, что необходимо динамически выбирать диапазон столбцов и помещать их в тип данных LabledPoints. Как новичок в Spark, мне интересно, есть ли какой-либо индексный способ выбрать диапазон столбцов в RDD. Что-то вроде temp_data = data[, 101:211]
в R. Есть что-то вроде val temp_data = data.filter(_.column_index in range(101:211)...
?
Любая мысль приветствуется и ценится.