У меня есть большой фрейм данных с почти 1 млн строк (транзакций) и 2600 столбцов (элементов). Значения в наборе данных - это 1 и NA. Тип данных всех значений фактор. Я хочу добавить новый столбец в конец кадра данных, который показывает сумму всех единиц в каждой строке.
Вот код R, который я написал:
for(i in 1:nrow(dataset){
counter<-0
for(j in 1:ncol(dataset){
if(!is.na(dataset[i,j])){
counter<- counter+1
}
}
dataset[i,ncol(dataset)+1]<-counter
}
Но это было очень долгое время, когда он работал в R studio, потому что время работы составляет O (n ^ 2). Мне интересно, есть ли другой способ сделать это или способ улучшить этот алгоритм? (Машина имеет 80Gb памяти)
?apply
или, если это слишком медленно, Rcpp. - person joran   schedule 12.09.2013