Powiązane publikacje 'dplyr'


R do Pythona: przewodnik po odtwarzaniu wygodnych złączeń Dplyr w Pythonie
Wstęp Jeśli jesteś jednym z wielu użytkowników R, którzy przechodzą na Pythona, może się okazać, że będziesz polegać na wygodzie niektórych z najbardziej lubianych bibliotek R. Na pozór przejście od wygody i prostoty R może wydawać się nieco zniechęcające, ponieważ krajobraz Pythona, choć obszerny, często może generować coś, co wydaje się zbyt wieloma tłumaczeniami dla danej funkcjonalności. Znalezienie prostych tłumaczeń nie zawsze jest łatwe. Celem tego jest podzielenie się..

Powiązane pytania 'dplyr'

dplyr funkcje group_by i cummean
Spodziewałem się, że poniższy kod wygeneruje ramkę danych z trzema wierszami, z których każdy reprezentuje skumulowaną średnią wartość mpg po obliczeniu średniej dla każdej grupy cyl : library(dplyr) mtcars %>% arrange(cyl) %>%...
2901 wyświetlenia
schedule 25.08.2022

R / dplyr : Jak używać funkcji filtrowania w połączeniu z operatorem potokowym %›%?
Jestem pewien, że jest na to idiom, ale jak dokładnie potokować maskę logiczną lub zaznaczenie wiersza do operacji filtrowania za pomocą dplyr. Na przykład tutaj chcę wybrać wiersze foo, dla których id jest zduplikowany: foo$id %>%...
799 wyświetlenia
schedule 11.08.2022

Co oznacza funkcja %›% w R?
Widziałem użycie funkcji %>% (procent większy niż procent) w niektórych pakietach, takich jak dplyr i rvest . Co to znaczy? Czy to sposób na pisanie bloków zamykających w R?
377969 wyświetlenia
schedule 11.07.2022

Konwertowanie/tłumaczenie SQL na dplyr Połączenie lewe z wieloma kryteriami
Oto konfiguracja (to naprawdę nie jest takie skomplikowane...): Tabela Tytuły stanowisk | PersonID | JobTitle | StartDate | EndDate | |----------|----------|-----------|---------| | A | A1 | 1 | 5 | | A | A2...
815 wyświetlenia
schedule 19.07.2022

Jak przekazać nazwę kolumny jako parametr do funkcji w dplyr?
Chcę zrobić to samo, co tutaj ale z dplyr i jeszcze jedną kolumną. Chcę wybrać kolumnę za pomocą zmiennej ciągu, ale na górze chcę też normalnie wybrać drugą kolumnę. Potrzebuję tego, ponieważ mam funkcję, która wybiera kilka kolumn według...
5022 wyświetlenia
schedule 17.09.2022

Awaria dplyr podczas obliczania różnicy opóźnionej
Mam ramkę danych 4 miliony wierszy i 1,4 miliona różnych wartości zmiennej grupującej. Przykładowy DF wygląda tak: > df date id 1 2015-06-25 4333864 2 2015-06-25 3867895 3 2015-06-25 4333866 4 2015-06-25 4333868 5...
105 wyświetlenia
schedule 18.09.2022

Zachowaj wiersze do pierwszego wystąpienia wartości w kolumnie według grupy. Grupy bez dozwolonej wartości
Mam ramkę danych taką jak ta: > df id type 1 1 a 2 1 a 3 1 b 4 1 a 5 1 b 6 2 a 7 2 a 8 2 b 9 3 a 10 3 a Chcę zachować wszystkie wiersze dla każdej grupy (id) do pierwszego wystąpienia wartości „b” w...
2146 wyświetlenia
schedule 10.08.2022

rozwiń ramki danych wewnątrz ramki danych
Mam ramkę danych o następującej strukturze: language subID sessionID rdm (chr) (fctr) (fctr) (chr) 1 Dutch 13602 13257 <data.frame [676,3]> 2 Dutch 13602 125354 <data.frame...
912 wyświetlenia
schedule 06.07.2022

Używanie group_by i mutacji w pakiecie dplyr do utworzenia nowej zmiennej czynnika według zmiennej id
Mam hierarchiczną ramkę danych w długim formacie, w której każdy wiersz reprezentuje relacje, z których wiele może należeć do jednej osoby. Oto kod dla małego przykładowego zestawu danych: df <- data.frame(id = as.factor(c(1,1,1,2,2,3,4,4)),...
6313 wyświetlenia
schedule 27.09.2022

Pakiety o tej samej nazwie funkcji
Biblioteki o tej samej nazwie funkcji w R wydają się bardzo denerwujące. Jaki jest najłatwiejszy sposób rozwiązania problemów takich jak poniższe? Attaching package: ‘dplyr’ The following objects are masked from ‘package:stats’: filter, lag The...
796 wyświetlenia
schedule 12.07.2022

pasujący wiersz dla danych uzyskanych z dplyr summary_each [duplikat]
Chcę wiedzieć, jaka jest wartość Sepal.Length dla minimalnej wartości Sepal.Width dla każdego gatunku, ale nie mogę dowiedzieć się, jak uzyskać pasujące wiersze dla wiersza, który ma minimalną wartość Sepal.Width. library(dplyr) itable <-...
49 wyświetlenia
schedule 01.07.2022

R Shiny dplyr multi select dla błędu filtra podczas używania src_postgres
Mała aplikacja do filtrowania sprzedaży według firmy library(dplyr) library(tidyr) library(DT) company=c("A","L","S","T","W","A","L","S","T","W") sales=c(120,140,160,180,200,120,140,160,180,200) server <- function(input, output) {...
215 wyświetlenia
schedule 03.08.2022

Jak zastosować summarise_each do wszystkich kolumn z wyjątkiem jednej? [duplikować]
Analizuję zestaw danych z wieloma kolumnami (prawie 30 kolumn). Chcę pogrupować dane na podstawie dwóch kolumn i zastosować funkcje sumy i średniej do wszystkich kolumn z wyjątkiem sygnatury czasowej. Jak używać summarise_each we wszystkich...
9609 wyświetlenia
schedule 25.08.2022

Grupowanie połączonych par unikalnych identyfikatorów przy użyciu R [duplikat]
Próbuję połączyć ze sobą pary unikalnych identyfikatorów za pomocą R. Biorąc pod uwagę poniższy przykład, mam dwa identyfikatory (tutaj ID1 i ID2), które wskazują na powiązanie. Próbuję utworzyć grupy wierszy, które są połączone. W tym przykładzie A...
446 wyświetlenia
schedule 03.07.2022

Jak mogę wykreślić ggplot scaloną ramkę danych złożoną z czynników z osią X posortowaną alfabetycznie?
Mam dwie ramki danych narodów A i B, niektóre pasują. Za pomocą rbind() i dplyr::summarise() generuję nową ramkę danych z liczbą dla każdego kraju. W celu ggplot() z alfabetycznie posortowaną osią x sortuję ramkę danych według kraju z order()...
181 wyświetlenia
schedule 18.07.2022

znajdź wartość najbliższą x według grupy w dplyr [duplikat]
library(dplyr) a <- data_frame(id = c("A","A","A","B","B","B"), b = c(1.2, 1.5, 1.8, 1.1, 1.6, 1.4)) Teraz chciałbym pobrać wartości najbliższe 1,43 dla każdej kategorii w id. Pomyślałem, że przyda mi się: a %>%...
8553 wyświetlenia
schedule 07.08.2022

Dodaj indeks porządku sortowania dla ręcznie sortowanych data.tables [duplikat]
Mam data.table lub data.frame library(data.table) DT <- data.table(id = 1:9, name= rep(c('b','a','c'), each = 3)) gdzie kolumna name jest porządkowana ręcznie, ale zawsze pogrupowana. Jak obliczyć kolumnę name_order column, aby uzyskać...
69 wyświetlenia
schedule 09.07.2022

Nie mogę zrozumieć błędu full_join: atrybuty o różnych rozmiarach
Napotkałem błąd, którego nigdy wcześniej nie widziałem, a dość obszerne wyszukiwanie w google/SO/listach dyskusyjnych okazało się puste. Podczas używania full_join w pętli for otrzymuję następujący błąd po wykonaniu 75% iteracji pętli for:...
630 wyświetlenia
schedule 24.07.2022

Zastąp podzbiór ramki danych operacjami łączenia dplyr
Załóżmy, że potraktowałem niektóre wartości kolumn ramki danych w ten sposób: id animal weight height ... 1 dog 23.0 2 cat NA 3 duck 1.2 4 fairy 0.2 5 snake BAD df <- data.frame(id = seq(1:5),...
4627 wyświetlenia
schedule 09.08.2022

r agregują i zwijają kilka komórek w jedną
Mam ramkę danych: x <- data.frame(id = 1:18, super = c(rep("A", 12), rep("B", 6)), category = c(rep("one", 6), rep("two", 6), rep("three", 6)), root = sort(rep(letters[1:6], 3)),...
416 wyświetlenia
schedule 14.08.2022