Публикации по теме 'dplyr'


R to Python: руководство по воссозданию удобных объединений Dplyr в Python
Введение Если вы один из многих пользователей R, которые переходят на Python, вы можете оказаться в зависимости от удобства некоторых из самых любимых библиотек R. На первый взгляд переход от удобства и простоты R может показаться немного пугающим, поскольку ландшафт Python, хотя и достаточный, часто может производить то, что кажется слишком большим количеством переводов для данной части функциональности. Найти прямой перевод не всегда легко. Цель этого — поделиться осознанной..

Вопросы по теме 'dplyr'

data.table vs dplyr: может ли один сделать что-то хорошо, а другой не может или плохо?
Обзор Я относительно знаком с data.table , не так много с dplyr . Я прочитал несколько dplyr виньеток и примеров, которые появлялись на SO, и пока что мои выводы таковы: data.table и dplyr сопоставимы по скорости, за исключением...
141416 просмотров
schedule 29.11.2023

Есть ли метод R dplyr для слияния с all = TRUE?
У меня есть два фрейма данных R, которые я хочу объединить. В прямом R вы можете: cost <- data.frame(farm=c('farm A', 'office'), cost=c(10, 100)) trees <- data.frame(farm=c('farm A', 'farm B'), trees=c(20,30)) merge(cost, trees, all=TRUE)...
26038 просмотров
schedule 16.11.2023

Подсчитайте количество строк по группе с помощью dplyr
Я использую набор данных mtcars . Я хочу найти количество записей для определенной комбинации данных. Что-то очень похожее на предложение count(*) group by в SQL. ddply() от plyr работает на меня library(plyr) ddply(mtcars,...
145857 просмотров
schedule 06.12.2023

функции dplyr group_by и cummean
Я ожидал, что приведенный ниже код выведет фрейм данных с тремя строками, каждая строка представляет совокупное среднее значение миль на галлон после вычисления среднего значения для каждой группы cyl : library(dplyr) mtcars %>% arrange(cyl)...
2901 просмотров
schedule 25.08.2022

перекрывающиеся группы в dplyr
Я пытаюсь вычислить "скользящую" сводную статистику на основе фактора группирования. Есть ли хороший способ обработки по (перекрывающимся) группам на основе (скажем) упорядоченного фактора? В качестве примера скажем, я хочу вычислить сумму val...
1055 просмотров
schedule 31.01.2024

R/dplyr: Как использовать функции фильтра в сочетании с конвейерным оператором %›%?
Я уверен, что для этого есть идиома, но как именно мне передать логическую маску или выбор строки в операцию фильтра с помощью dplyr. Например, здесь я хочу выделить строки foo, для которых дублируется идентификатор: foo$id %>% duplicated...
799 просмотров
schedule 11.08.2022

Как использовать dplyr ::range (desc ()) при использовании строки в качестве имени столбца?
Как я могу использовать dplyr::arrange(dplyr::desc()) и передать строку в качестве имени столбца? Вот образец набора данных: df <- data.frame(a = 1:3, b = 3:1) Примеры, которые работают: df %>% dplyr::arrange(b) df %>%...
3141 просмотров
schedule 18.04.2024

Что означает функция% ›% в R?
Я видел использование функции %>% (процент больше, чем процент) в некоторых пакетах, таких как dplyr и rvest . Что это значит? Это способ написать закрывающие блоки в R?
377969 просмотров
schedule 11.07.2022

Преобразование/преобразование SQL в левое соединение dplyr с несколькими критериями
Вот установка (это на самом деле не так сложно...): Таблица Названия должностей | PersonID | JobTitle | StartDate | EndDate | |----------|----------|-----------|---------| | A | A1 | 1 | 5 | | A | A2 |...
815 просмотров
schedule 19.07.2022

используйте% ›% с функциями замены, такими как colnames ()‹ -
Как я могу использовать оператор pipe для перенаправления функции замены, такой как colnames()<- ? Вот что я пытаюсь сделать: library(dplyr) averages_df <- group_by(mtcars, cyl) %>% summarise(mean(disp), mean(hp))...
48050 просмотров
schedule 01.01.2024

Как передать имя столбца в качестве параметра для работы в dplyr?
Я хочу сделать то же самое, что и здесь но с дплером и еще одним столбиком. Я хочу выбрать столбец с помощью строковой переменной, но наверху я также хочу обычно выбрать второй столбец. Мне это нужно, потому что у меня есть функция, которая...
5022 просмотров
schedule 17.09.2022

tbl_df Dplyr дает неожиданное поведение при выборе столбца по строке
Часто при программном использовании dplyr мне нужно выбрать столбец по его имени, где имя столбца хранится в виде строки в некоторой переменной. Я заметил, что попытки сделать это с помощью dplyr часто приводят к неожиданным результатам. Похоже,...
952 просмотров
schedule 04.03.2024

summarise_each для двух переменных
У меня есть кадр данных, который выглядит примерно так: df <- data.frame( text = c(1:12), person = c(c(rep("John", 6)), c(rep("Jane", 6))), lemma = c("he", "he", "he", "his", "it", "she", "he", "she", "she", "his", "it",...
329 просмотров
schedule 16.11.2023

Найдите, сколько строк для каждого формата файла в наборе данных, используя глаголы dplyr
Мне нужно использовать «group_by» и «summarise» (часть пакета dplyr), чтобы узнать, сколько строк есть для каждого типа файла в наборе данных. Я пытаюсь понять, как это работает, потому что позже мне нужно использовать результат для других целей. Я...
37 просмотров
schedule 02.03.2024

R: dplyr - Переименовать имя столбца по позиции вместо имени
Я хочу знать, есть ли способ переименовать имена столбцов по положению столбца, а не по имени столбца. Ниже фрагмент кода показывает, как изменить имя. suppressPackageStartupMessages(library(dplyr)) gd_url <- "http://tiny.cc/gapminder"...
11705 просмотров
schedule 11.12.2023

получить имя объекта lhs при передаче с помощью dplyr
Я хотел бы иметь функцию, которая может использовать оператор канала, экспортированный из dplyr. Я не пользуюсь магритром. df %>% my_function Как я могу получить имя df? Если я попытаюсь my_function <-...
747 просмотров
schedule 02.04.2024

Использование функций с dplyr для анализа дат
У меня есть код в R, который манипулирует временными метками с помощью dyplr. Код ниже. По сути, мы отправляем электронное письмо в определенное время и получаем ответ — если он есть. Я хотел извлечь ряд атрибутов как из отправленных, так и из...
393 просмотров
schedule 31.01.2024

Сбой dplyr при использовании вычисления разницы с задержкой
У меня есть кадр данных 4 миллиона строк и 1,4 миллиона различных значений группирующей переменной. Пример ДФ выглядит так: > df date id 1 2015-06-25 4333864 2 2015-06-25 3867895 3 2015-06-25 4333866 4 2015-06-25...
105 просмотров
schedule 18.09.2022

Сохранять строки до первого появления значения в столбце по группам. Группы без значения разрешены
У меня есть такой фрейм данных: > df id type 1 1 a 2 1 a 3 1 b 4 1 a 5 1 b 6 2 a 7 2 a 8 2 b 9 3 a 10 3 a Я хочу сохранить все строки для каждой группы (id) до первого появления значения «b» в...
2146 просмотров
schedule 10.08.2022

R dplyr Обобщая условия
У меня есть набор данных элементов, загруженных с веб-сайта на основе отчетов, которые мы генерируем. Идея состоит в том, чтобы удалить отчеты, которые больше не нужны, исходя из количества загрузок. Логика в основном состоит в том, чтобы подсчитать...
1456 просмотров
schedule 27.10.2022