Публикации по теме 'dplyr'
R to Python: руководство по воссозданию удобных объединений Dplyr в Python
Введение
Если вы один из многих пользователей R, которые переходят на Python, вы можете оказаться в зависимости от удобства некоторых из самых любимых библиотек R. На первый взгляд переход от удобства и простоты R может показаться немного пугающим, поскольку ландшафт Python, хотя и достаточный, часто может производить то, что кажется слишком большим количеством переводов для данной части функциональности. Найти прямой перевод не всегда легко.
Цель этого — поделиться осознанной..
Вопросы по теме 'dplyr'
data.table vs dplyr: может ли один сделать что-то хорошо, а другой не может или плохо?
Обзор
Я относительно знаком с data.table , не так много с dplyr . Я прочитал несколько dplyr виньеток и примеров, которые появлялись на SO, и пока что мои выводы таковы:
data.table и dplyr сопоставимы по скорости, за исключением...
141416 просмотров
schedule
29.11.2023
Есть ли метод R dplyr для слияния с all = TRUE?
У меня есть два фрейма данных R, которые я хочу объединить. В прямом R вы можете:
cost <- data.frame(farm=c('farm A', 'office'), cost=c(10, 100))
trees <- data.frame(farm=c('farm A', 'farm B'), trees=c(20,30))
merge(cost, trees, all=TRUE)...
26038 просмотров
schedule
16.11.2023
Подсчитайте количество строк по группе с помощью dplyr
Я использую набор данных mtcars . Я хочу найти количество записей для определенной комбинации данных. Что-то очень похожее на предложение count(*) group by в SQL. ddply() от plyr работает на меня
library(plyr)
ddply(mtcars,...
145857 просмотров
schedule
06.12.2023
функции dplyr group_by и cummean
Я ожидал, что приведенный ниже код выведет фрейм данных с тремя строками, каждая строка представляет совокупное среднее значение миль на галлон после вычисления среднего значения для каждой группы cyl :
library(dplyr)
mtcars %>%
arrange(cyl)...
2901 просмотров
schedule
25.08.2022
перекрывающиеся группы в dplyr
Я пытаюсь вычислить "скользящую" сводную статистику на основе фактора группирования. Есть ли хороший способ обработки по (перекрывающимся) группам на основе (скажем) упорядоченного фактора?
В качестве примера скажем, я хочу вычислить сумму val...
1055 просмотров
schedule
31.01.2024
R/dplyr: Как использовать функции фильтра в сочетании с конвейерным оператором %›%?
Я уверен, что для этого есть идиома, но как именно мне передать логическую маску или выбор строки в операцию фильтра с помощью dplyr.
Например, здесь я хочу выделить строки foo, для которых дублируется идентификатор:
foo$id %>% duplicated...
799 просмотров
schedule
11.08.2022
Как использовать dplyr ::range (desc ()) при использовании строки в качестве имени столбца?
Как я могу использовать dplyr::arrange(dplyr::desc()) и передать строку в качестве имени столбца?
Вот образец набора данных:
df <- data.frame(a = 1:3, b = 3:1)
Примеры, которые работают:
df %>% dplyr::arrange(b)
df %>%...
3141 просмотров
schedule
18.04.2024
Что означает функция% ›% в R?
Я видел использование функции %>% (процент больше, чем процент) в некоторых пакетах, таких как dplyr и rvest . Что это значит? Это способ написать закрывающие блоки в R?
377969 просмотров
schedule
11.07.2022
Преобразование/преобразование SQL в левое соединение dplyr с несколькими критериями
Вот установка (это на самом деле не так сложно...):
Таблица Названия должностей
| PersonID | JobTitle | StartDate | EndDate |
|----------|----------|-----------|---------|
| A | A1 | 1 | 5 |
| A | A2 |...
815 просмотров
schedule
19.07.2022
используйте% ›% с функциями замены, такими как colnames ()‹ -
Как я могу использовать оператор pipe для перенаправления функции замены, такой как colnames()<- ?
Вот что я пытаюсь сделать:
library(dplyr)
averages_df <-
group_by(mtcars, cyl) %>%
summarise(mean(disp), mean(hp))...
48050 просмотров
schedule
01.01.2024
Как передать имя столбца в качестве параметра для работы в dplyr?
Я хочу сделать то же самое, что и здесь но с дплером и еще одним столбиком.
Я хочу выбрать столбец с помощью строковой переменной, но наверху я также хочу обычно выбрать второй столбец. Мне это нужно, потому что у меня есть функция, которая...
5022 просмотров
schedule
17.09.2022
tbl_df Dplyr дает неожиданное поведение при выборе столбца по строке
Часто при программном использовании dplyr мне нужно выбрать столбец по его имени, где имя столбца хранится в виде строки в некоторой переменной.
Я заметил, что попытки сделать это с помощью dplyr часто приводят к неожиданным результатам. Похоже,...
952 просмотров
schedule
04.03.2024
summarise_each для двух переменных
У меня есть кадр данных, который выглядит примерно так:
df <- data.frame(
text = c(1:12),
person = c(c(rep("John", 6)), c(rep("Jane", 6))),
lemma = c("he", "he", "he", "his", "it", "she", "he",
"she", "she", "his", "it",...
329 просмотров
schedule
16.11.2023
Найдите, сколько строк для каждого формата файла в наборе данных, используя глаголы dplyr
Мне нужно использовать «group_by» и «summarise» (часть пакета dplyr), чтобы узнать, сколько строк есть для каждого типа файла в наборе данных. Я пытаюсь понять, как это работает, потому что позже мне нужно использовать результат для других целей. Я...
37 просмотров
schedule
02.03.2024
R: dplyr - Переименовать имя столбца по позиции вместо имени
Я хочу знать, есть ли способ переименовать имена столбцов по положению столбца, а не по имени столбца.
Ниже фрагмент кода показывает, как изменить имя.
suppressPackageStartupMessages(library(dplyr))
gd_url <- "http://tiny.cc/gapminder"...
11705 просмотров
schedule
11.12.2023
получить имя объекта lhs при передаче с помощью dplyr
Я хотел бы иметь функцию, которая может использовать оператор канала, экспортированный из dplyr. Я не пользуюсь магритром.
df %>% my_function
Как я могу получить имя df? Если я попытаюсь
my_function <-...
747 просмотров
schedule
02.04.2024
Использование функций с dplyr для анализа дат
У меня есть код в R, который манипулирует временными метками с помощью dyplr. Код ниже. По сути, мы отправляем электронное письмо в определенное время и получаем ответ — если он есть. Я хотел извлечь ряд атрибутов как из отправленных, так и из...
393 просмотров
schedule
31.01.2024
Сбой dplyr при использовании вычисления разницы с задержкой
У меня есть кадр данных 4 миллиона строк и 1,4 миллиона различных значений группирующей переменной. Пример ДФ выглядит так:
> df
date id
1 2015-06-25 4333864
2 2015-06-25 3867895
3 2015-06-25 4333866
4 2015-06-25...
105 просмотров
schedule
18.09.2022
Сохранять строки до первого появления значения в столбце по группам. Группы без значения разрешены
У меня есть такой фрейм данных:
> df
id type
1 1 a
2 1 a
3 1 b
4 1 a
5 1 b
6 2 a
7 2 a
8 2 b
9 3 a
10 3 a
Я хочу сохранить все строки для каждой группы (id) до первого появления значения «b» в...
2146 просмотров
schedule
10.08.2022
R dplyr Обобщая условия
У меня есть набор данных элементов, загруженных с веб-сайта на основе отчетов, которые мы генерируем. Идея состоит в том, чтобы удалить отчеты, которые больше не нужны, исходя из количества загрузок. Логика в основном состоит в том, чтобы подсчитать...
1456 просмотров
schedule
27.10.2022