Найдите, сколько строк для каждого формата файла в наборе данных, используя глаголы dplyr

Мне нужно использовать «group_by» и «summarise» (часть пакета dplyr), чтобы узнать, сколько строк есть для каждого типа файла в наборе данных. Я пытаюсь понять, как это работает, потому что позже мне нужно использовать результат для других целей. Я пробовал что-то вроде этого:

```{r problem}
grouped_files <- group_by(files_ENCODE, V5)
files_types <- summarise(grouped_files, V5)
```

При этом V5 — это столбец с форматом файла, а files_ENCODE — набор данных со всем, что в нем содержится. Я никогда раньше не использовал R, и даже мой друг Google не смог помочь мне научиться использовать эти две функции. Пожалуйста помоги! :О


person Yarmiz    schedule 25.03.2015    source источник


Ответы (1)


set.seed(123)
file_data <- data.frame(V5 = sample(c("format_1", "format_2", "format_3"), 20, replace = TRUE))

Вы можете просто сделать это с помощью table:

table(file_data)
file_data
format_1 format_2 format_3 
       6        6        8 

Но если это должно быть dplyr, сделайте следующее:

file_data %>% group_by(V5) %>% summarise(n = n())
Source: local data frame [3 x 2]

        V5 n()
1 format_1   6
2 format_2   6
3 format_3   8
person DatamineR    schedule 25.03.2015
comment
Благодарю вас! Работает идеально! Я просто не знал, как написать все это. Если я могу задать другой вопрос, как я уже сказал, я должен использовать это для чего-то другого: графика. Я могу использовать ggplot (я получил пакет и использовал библиотеку), но когда я пытаюсь добавить в него информацию с помощью geom_bar, он выдает ошибку. Вот что я использовал: {r problem2} graph <- ggplot(data = types_fichiers, aes(x = V5, y = n())) graph + geom_bar() ошибка в n(): эта функция не должна вызываться напрямую - person Yarmiz; 26.03.2015
comment
Попробуйте ggplot(data = file_data_n, aes(x = V5, y = n)) + geom_bar(stat = "identity") - person DatamineR; 26.03.2015