Powiązane publikacje 'dplyr'


R do Pythona: przewodnik po odtwarzaniu wygodnych złączeń Dplyr w Pythonie
Wstęp Jeśli jesteś jednym z wielu użytkowników R, którzy przechodzą na Pythona, może się okazać, że będziesz polegać na wygodzie niektórych z najbardziej lubianych bibliotek R. Na pozór przejście od wygody i prostoty R może wydawać się nieco zniechęcające, ponieważ krajobraz Pythona, choć obszerny, często może generować coś, co wydaje się zbyt wieloma tłumaczeniami dla danej funkcjonalności. Znalezienie prostych tłumaczeń nie zawsze jest łatwe. Celem tego jest podzielenie się..

Powiązane pytania 'dplyr'

data.table vs dplyr: czy jeden może zrobić coś dobrze, a drugi nie potrafi lub robi słabo?
Przegląd Jestem stosunkowo zaznajomiony z data.table , nie za bardzo z dplyr . Przeczytałem kilka dplyr winiet i przykłady, które pojawiły się na SO, i jak dotąd moje wnioski są takie, że: data.table i dplyr są porównywalne pod...
141416 wyświetlenia
schedule 29.11.2023

Czy istnieje metoda R dplyr do łączenia z all=TRUE?
Mam dwie ramki danych R, które chcę połączyć. W prostym R możesz zrobić: cost <- data.frame(farm=c('farm A', 'office'), cost=c(10, 100)) trees <- data.frame(farm=c('farm A', 'farm B'), trees=c(20,30)) merge(cost, trees, all=TRUE) który...
26038 wyświetlenia
schedule 16.11.2023

Policz liczbę wierszy według grupy za pomocą dplyr
Używam zestawu danych mtcars . Chcę znaleźć liczbę rekordów dla określonej kombinacji danych. Coś bardzo podobnego do klauzuli count(*) group by w SQL. ddply() z plyr pracuje dla mnie library(plyr) ddply(mtcars, .(cyl,gear),nrow) ma...
145857 wyświetlenia
schedule 06.12.2023

dplyr funkcje group_by i cummean
Spodziewałem się, że poniższy kod wygeneruje ramkę danych z trzema wierszami, z których każdy reprezentuje skumulowaną średnią wartość mpg po obliczeniu średniej dla każdej grupy cyl : library(dplyr) mtcars %>% arrange(cyl) %>%...
2901 wyświetlenia
schedule 25.08.2022

nakładające się grupy w dplyr
Próbuję obliczyć „kroczące” statystyki podsumowujące na podstawie współczynnika grupowania. Czy istnieje dobry sposób na przetwarzanie przez (nakładające się) grupy w oparciu o (powiedzmy) uporządkowany czynnik? Załóżmy na przykład, że chcę...
1055 wyświetlenia
schedule 31.01.2024

R / dplyr : Jak używać funkcji filtrowania w połączeniu z operatorem potokowym %›%?
Jestem pewien, że jest na to idiom, ale jak dokładnie potokować maskę logiczną lub zaznaczenie wiersza do operacji filtrowania za pomocą dplyr. Na przykład tutaj chcę wybrać wiersze foo, dla których id jest zduplikowany: foo$id %>%...
799 wyświetlenia
schedule 11.08.2022

Co oznacza funkcja %›% w R?
Widziałem użycie funkcji %>% (procent większy niż procent) w niektórych pakietach, takich jak dplyr i rvest . Co to znaczy? Czy to sposób na pisanie bloków zamykających w R?
377969 wyświetlenia
schedule 11.07.2022

Konwertowanie/tłumaczenie SQL na dplyr Połączenie lewe z wieloma kryteriami
Oto konfiguracja (to naprawdę nie jest takie skomplikowane...): Tabela Tytuły stanowisk | PersonID | JobTitle | StartDate | EndDate | |----------|----------|-----------|---------| | A | A1 | 1 | 5 | | A | A2...
815 wyświetlenia
schedule 19.07.2022

użyj %›% z funkcjami zastępczymi, takimi jak colnames()‹-
Jak mogę użyć operatora potoku, aby potokować do funkcji zastępującej, takiej jak colnames()<- ? Oto, co próbuję zrobić: library(dplyr) averages_df <- group_by(mtcars, cyl) %>% summarise(mean(disp), mean(hp))...
48050 wyświetlenia
schedule 01.01.2024

Jak przekazać nazwę kolumny jako parametr do funkcji w dplyr?
Chcę zrobić to samo, co tutaj ale z dplyr i jeszcze jedną kolumną. Chcę wybrać kolumnę za pomocą zmiennej ciągu, ale na górze chcę też normalnie wybrać drugą kolumnę. Potrzebuję tego, ponieważ mam funkcję, która wybiera kilka kolumn według...
5022 wyświetlenia
schedule 17.09.2022

summarise_each dla dwóch zmiennych
Mam ramkę danych, która wygląda mniej więcej tak: df <- data.frame( text = c(1:12), person = c(c(rep("John", 6)), c(rep("Jane", 6))), lemma = c("he", "he", "he", "his", "it", "she", "he", "she", "she", "his", "it",...
329 wyświetlenia
schedule 16.11.2023

R: dplyr — Zmień nazwę kolumny według pozycji zamiast nazwy
Chcę wiedzieć, czy istnieje sposób na zmianę nazw kolumn według pozycji kolumny, zamiast zmieniać ją według nazwy kolumny. Poniższy fragment pokazuje, jak zmienić nazwę. suppressPackageStartupMessages(library(dplyr)) gd_url <-...
11705 wyświetlenia
schedule 11.12.2023

Używanie funkcji z dplyr do analizowania dat
Mam kod w R, który manipuluje znacznikami czasu za pomocą dyplr. Kod znajduje się poniżej. Zasadniczo wysyłamy e-mail o określonej godzinie i otrzymujemy odpowiedź - jeśli taka istnieje. Chciałem wyodrębnić wiele atrybutów zarówno z elementów...
393 wyświetlenia
schedule 31.01.2024

Awaria dplyr podczas obliczania różnicy opóźnionej
Mam ramkę danych 4 miliony wierszy i 1,4 miliona różnych wartości zmiennej grupującej. Przykładowy DF wygląda tak: > df date id 1 2015-06-25 4333864 2 2015-06-25 3867895 3 2015-06-25 4333866 4 2015-06-25 4333868 5...
105 wyświetlenia
schedule 18.09.2022

Zachowaj wiersze do pierwszego wystąpienia wartości w kolumnie według grupy. Grupy bez dozwolonej wartości
Mam ramkę danych taką jak ta: > df id type 1 1 a 2 1 a 3 1 b 4 1 a 5 1 b 6 2 a 7 2 a 8 2 b 9 3 a 10 3 a Chcę zachować wszystkie wiersze dla każdej grupy (id) do pierwszego wystąpienia wartości „b” w...
2146 wyświetlenia
schedule 10.08.2022

R dplyr Warunek podsumowujący
Mam zestaw danych elementów pobranych z witryny internetowej na podstawie generowanych przez nas raportów. Pomysł polega na usunięciu raportów, które nie są już potrzebne, na podstawie liczby pobrań. Logika polega zasadniczo na tym, aby policzyć...
1456 wyświetlenia
schedule 27.10.2022

Utwórz wiele wierszy warunkowych i dodaj określone wartości z innej ramki danych
Dzień dobry, Próbuję dodać nowe wiersze w ramce danych, w której mam dane z wielu źródeł. Próbuję dodać nowy wiersz na początku źródła i zastąpić wartości kolumn określonymi wartościami z innej tabeli. Aby dać ci przykład, załóżmy, że mam ramkę...
125 wyświetlenia
schedule 12.12.2023

rozwiń ramki danych wewnątrz ramki danych
Mam ramkę danych o następującej strukturze: language subID sessionID rdm (chr) (fctr) (fctr) (chr) 1 Dutch 13602 13257 <data.frame [676,3]> 2 Dutch 13602 125354 <data.frame...
912 wyświetlenia
schedule 06.07.2022

R wykonaj obliczenia na grupach dla podzbioru wierszy
Innymi słowy, chcę zgrupować według kolumny, a następnie wykonać obliczenia, używając tylko niektórych wierszy w grupie. Zbiór danych jaki posiadam to: LoanRefId Tran_Type TransactionAmount 103 11...
1041 wyświetlenia
schedule 26.11.2023

Odległość i klaster z dynamicznym dopasowaniem czasu
Używam dtw do obliczania odległości między kilkoma seriami i otrzymuję dziwne wyniki. Zauważ, że w przykładowych danych poniżej pierwszych 9 klientów to identyczne zbiory (A==B==C, D==E==F i G==H==I). Pozostałe rzędy służą tylko do szumu, co pozwala...
578 wyświetlenia