Powiązane publikacje 'dplyr'
R do Pythona: przewodnik po odtwarzaniu wygodnych złączeń Dplyr w Pythonie
Wstęp
Jeśli jesteś jednym z wielu użytkowników R, którzy przechodzą na Pythona, może się okazać, że będziesz polegać na wygodzie niektórych z najbardziej lubianych bibliotek R. Na pozór przejście od wygody i prostoty R może wydawać się nieco zniechęcające, ponieważ krajobraz Pythona, choć obszerny, często może generować coś, co wydaje się zbyt wieloma tłumaczeniami dla danej funkcjonalności. Znalezienie prostych tłumaczeń nie zawsze jest łatwe.
Celem tego jest podzielenie się..
Powiązane pytania 'dplyr'
data.table vs dplyr: czy jeden może zrobić coś dobrze, a drugi nie potrafi lub robi słabo?
Przegląd
Jestem stosunkowo zaznajomiony z data.table , nie za bardzo z dplyr . Przeczytałem kilka dplyr winiet i przykłady, które pojawiły się na SO, i jak dotąd moje wnioski są takie, że:
data.table i dplyr są porównywalne pod...
141416 wyświetlenia
schedule
29.11.2023
Czy istnieje metoda R dplyr do łączenia z all=TRUE?
Mam dwie ramki danych R, które chcę połączyć. W prostym R możesz zrobić:
cost <- data.frame(farm=c('farm A', 'office'), cost=c(10, 100))
trees <- data.frame(farm=c('farm A', 'farm B'), trees=c(20,30))
merge(cost, trees, all=TRUE)
który...
26038 wyświetlenia
schedule
16.11.2023
Policz liczbę wierszy według grupy za pomocą dplyr
Używam zestawu danych mtcars . Chcę znaleźć liczbę rekordów dla określonej kombinacji danych. Coś bardzo podobnego do klauzuli count(*) group by w SQL. ddply() z plyr pracuje dla mnie
library(plyr)
ddply(mtcars, .(cyl,gear),nrow)
ma...
145857 wyświetlenia
schedule
06.12.2023
dplyr funkcje group_by i cummean
Spodziewałem się, że poniższy kod wygeneruje ramkę danych z trzema wierszami, z których każdy reprezentuje skumulowaną średnią wartość mpg po obliczeniu średniej dla każdej grupy cyl :
library(dplyr)
mtcars %>%
arrange(cyl) %>%...
2901 wyświetlenia
schedule
25.08.2022
nakładające się grupy w dplyr
Próbuję obliczyć „kroczące” statystyki podsumowujące na podstawie współczynnika grupowania. Czy istnieje dobry sposób na przetwarzanie przez (nakładające się) grupy w oparciu o (powiedzmy) uporządkowany czynnik?
Załóżmy na przykład, że chcę...
1055 wyświetlenia
schedule
31.01.2024
R / dplyr : Jak używać funkcji filtrowania w połączeniu z operatorem potokowym %›%?
Jestem pewien, że jest na to idiom, ale jak dokładnie potokować maskę logiczną lub zaznaczenie wiersza do operacji filtrowania za pomocą dplyr.
Na przykład tutaj chcę wybrać wiersze foo, dla których id jest zduplikowany:
foo$id %>%...
799 wyświetlenia
schedule
11.08.2022
Co oznacza funkcja %›% w R?
Widziałem użycie funkcji %>% (procent większy niż procent) w niektórych pakietach, takich jak dplyr i rvest . Co to znaczy? Czy to sposób na pisanie bloków zamykających w R?
377969 wyświetlenia
schedule
11.07.2022
Konwertowanie/tłumaczenie SQL na dplyr Połączenie lewe z wieloma kryteriami
Oto konfiguracja (to naprawdę nie jest takie skomplikowane...):
Tabela Tytuły stanowisk
| PersonID | JobTitle | StartDate | EndDate |
|----------|----------|-----------|---------|
| A | A1 | 1 | 5 |
| A | A2...
815 wyświetlenia
schedule
19.07.2022
użyj %›% z funkcjami zastępczymi, takimi jak colnames()‹-
Jak mogę użyć operatora potoku, aby potokować do funkcji zastępującej, takiej jak colnames()<- ?
Oto, co próbuję zrobić:
library(dplyr)
averages_df <-
group_by(mtcars, cyl) %>%
summarise(mean(disp), mean(hp))...
48050 wyświetlenia
schedule
01.01.2024
Jak przekazać nazwę kolumny jako parametr do funkcji w dplyr?
Chcę zrobić to samo, co tutaj ale z dplyr i jeszcze jedną kolumną.
Chcę wybrać kolumnę za pomocą zmiennej ciągu, ale na górze chcę też normalnie wybrać drugą kolumnę. Potrzebuję tego, ponieważ mam funkcję, która wybiera kilka kolumn według...
5022 wyświetlenia
schedule
17.09.2022
summarise_each dla dwóch zmiennych
Mam ramkę danych, która wygląda mniej więcej tak:
df <- data.frame(
text = c(1:12),
person = c(c(rep("John", 6)), c(rep("Jane", 6))),
lemma = c("he", "he", "he", "his", "it", "she", "he",
"she", "she", "his", "it",...
329 wyświetlenia
schedule
16.11.2023
R: dplyr — Zmień nazwę kolumny według pozycji zamiast nazwy
Chcę wiedzieć, czy istnieje sposób na zmianę nazw kolumn według pozycji kolumny, zamiast zmieniać ją według nazwy kolumny.
Poniższy fragment pokazuje, jak zmienić nazwę.
suppressPackageStartupMessages(library(dplyr))
gd_url <-...
11705 wyświetlenia
schedule
11.12.2023
Używanie funkcji z dplyr do analizowania dat
Mam kod w R, który manipuluje znacznikami czasu za pomocą dyplr. Kod znajduje się poniżej. Zasadniczo wysyłamy e-mail o określonej godzinie i otrzymujemy odpowiedź - jeśli taka istnieje. Chciałem wyodrębnić wiele atrybutów zarówno z elementów...
393 wyświetlenia
schedule
31.01.2024
Awaria dplyr podczas obliczania różnicy opóźnionej
Mam ramkę danych 4 miliony wierszy i 1,4 miliona różnych wartości zmiennej grupującej. Przykładowy DF wygląda tak:
> df
date id
1 2015-06-25 4333864
2 2015-06-25 3867895
3 2015-06-25 4333866
4 2015-06-25 4333868
5...
105 wyświetlenia
schedule
18.09.2022
Zachowaj wiersze do pierwszego wystąpienia wartości w kolumnie według grupy. Grupy bez dozwolonej wartości
Mam ramkę danych taką jak ta:
> df
id type
1 1 a
2 1 a
3 1 b
4 1 a
5 1 b
6 2 a
7 2 a
8 2 b
9 3 a
10 3 a
Chcę zachować wszystkie wiersze dla każdej grupy (id) do pierwszego wystąpienia wartości „b” w...
2146 wyświetlenia
schedule
10.08.2022
R dplyr Warunek podsumowujący
Mam zestaw danych elementów pobranych z witryny internetowej na podstawie generowanych przez nas raportów. Pomysł polega na usunięciu raportów, które nie są już potrzebne, na podstawie liczby pobrań. Logika polega zasadniczo na tym, aby policzyć...
1456 wyświetlenia
schedule
27.10.2022
Utwórz wiele wierszy warunkowych i dodaj określone wartości z innej ramki danych
Dzień dobry,
Próbuję dodać nowe wiersze w ramce danych, w której mam dane z wielu źródeł. Próbuję dodać nowy wiersz na początku źródła i zastąpić wartości kolumn określonymi wartościami z innej tabeli.
Aby dać ci przykład, załóżmy, że mam ramkę...
125 wyświetlenia
schedule
12.12.2023
rozwiń ramki danych wewnątrz ramki danych
Mam ramkę danych o następującej strukturze:
language subID sessionID rdm
(chr) (fctr) (fctr) (chr)
1 Dutch 13602 13257 <data.frame [676,3]>
2 Dutch 13602 125354 <data.frame...
912 wyświetlenia
schedule
06.07.2022
R wykonaj obliczenia na grupach dla podzbioru wierszy
Innymi słowy, chcę zgrupować według kolumny, a następnie wykonać obliczenia, używając tylko niektórych wierszy w grupie.
Zbiór danych jaki posiadam to:
LoanRefId Tran_Type TransactionAmount
103 11...
1041 wyświetlenia
schedule
26.11.2023
Odległość i klaster z dynamicznym dopasowaniem czasu
Używam dtw do obliczania odległości między kilkoma seriami i otrzymuję dziwne wyniki. Zauważ, że w przykładowych danych poniżej pierwszych 9 klientów to identyczne zbiory (A==B==C, D==E==F i G==H==I). Pozostałe rzędy służą tylko do szumu, co pozwala...
578 wyświetlenia
schedule
12.11.2023