Publicații conexe 'dplyr'


R la Python: un ghid pentru recrearea conexiunilor convenabile ale Dplyr în Python
Introducere Dacă sunteți unul dintre mulți utilizatori R care fac trecerea la python, s-ar putea să vă aflați în funcție de comoditatea unora dintre cele mai îndrăgite biblioteci ale lui R. La suprafață, saltul de la comoditatea și simplitatea lui R poate părea puțin descurajantă, deoarece peisajul python, deși amplu, poate produce adesea ceea ce par prea multe traduceri pentru o anumită piesă de funcționalitate. Nu este întotdeauna ușor să găsești traduceri directe. Scopul acestui..

Întrebări înrudite 'dplyr'

dplyr group_by și funcțiile cummean
Mă așteptam ca codul de mai jos să scoată un cadru de date cu trei rânduri, fiecare rând reprezentând valoarea medie cumulativă a mpg după calcularea mediei pentru fiecare grup de cyl : library(dplyr) mtcars %>% arrange(cyl) %>%...
2901 vederi
schedule 25.08.2022

R / dplyr: Cum să utilizați funcțiile de filtrare împreună cu operatorul de pipelining %›%?
Sunt sigur că există o expresie pentru a face acest lucru, dar cum anume canalizez o mască booleană sau o selecție de rând la o operație de filtrare folosind dplyr. De exemplu, aici vreau să selectez rândurile de foo pentru care id-ul este...
799 vederi
schedule 11.08.2022

Ce înseamnă funcția %›% în R?
Am văzut utilizarea funcției %>% (procent mai mare decât procent) în unele pachete precum dplyr și rvest . Ce înseamnă? Este o modalitate de a scrie blocuri de închidere în R?
377969 vederi
schedule 11.07.2022

Conversia / traducerea SQL în dplyr Left Join cu mai multe criterii
Iată configurația (nu este chiar atât de complicat...): Tabelul JobTitle | PersonID | JobTitle | StartDate | EndDate | |----------|----------|-----------|---------| | A | A1 | 1 | 5 | | A | A2 | 6...
815 vederi
schedule 19.07.2022

Cum se transmite numele coloanei ca parametru pentru a funcționa în dplyr?
Vreau să fac același lucru ca aici dar cu dplyr si inca o coloana. Vreau să selectez o coloană printr-o variabilă șir, dar deasupra vreau să selectez și oa doua coloană în mod normal. Am nevoie de asta pentru că am o funcție care selectează...
5022 vederi
schedule 17.09.2022

dplyr crash când se utilizează calculul diferențelor întârziate
Am un cadru de date de 4 milioane de rânduri și 1,4 milioane de valori distincte ale unei variabile de grupare. Exemplul DF arată astfel: > df date id 1 2015-06-25 4333864 2 2015-06-25 3867895 3 2015-06-25 4333866 4...
105 vederi
schedule 18.09.2022

Păstrați rândurile până la prima apariție a unei valori într-o coloană, pe grup. Grupuri fără valoare permise
Am un cadru de date ca acesta: > df id type 1 1 a 2 1 a 3 1 b 4 1 a 5 1 b 6 2 a 7 2 a 8 2 b 9 3 a 10 3 a Vreau să păstrez toate rândurile pentru fiecare grup (id) până la prima apariție a valorii...
2146 vederi
schedule 10.08.2022

extinde cadrele de date în cadrul cadrului de date
Am un cadru de date cu următoarea structură: language subID sessionID rdm (chr) (fctr) (fctr) (chr) 1 Dutch 13602 13257 <data.frame [676,3]> 2 Dutch 13602 125354 <data.frame...
912 vederi
schedule 06.07.2022

Folosind group_by și mutate în pachetul dplyr pentru a crea o nouă variabilă factor după variabila id
Am un cadru de date ierarhic în format lung, unde fiecare rând reprezintă relații, dintre care multe pot aparține unei singure persoane. Iată codul pentru un mic exemplu de set de date: df <- data.frame(id = as.factor(c(1,1,1,2,2,3,4,4)),...
6313 vederi
schedule 27.09.2022

Pachete cu același nume de funcție
Bibliotecile cu același nume de funcție în R par a fi foarte enervante. Care este cel mai simplu mod de a rezolva probleme precum următoarele? Attaching package: ‘dplyr’ The following objects are masked from ‘package:stats’: filter, lag The...
796 vederi
schedule 12.07.2022

rând de potrivire pentru datele obținute din dplyr summarize_each [duplicat]
Vreau să știu care este Sepal.Length pentru Sepal.Width minim pentru fiecare specie, dar nu îmi pot da seama cum să obțin rândurile potrivite pentru rândul care are Sepal.Width minim. library(dplyr) itable <- tbl_df(iris) #print(itable) a <-...
49 vederi
schedule 01.07.2022

R Shiny dplyr multi select pentru eroare de filtru atunci când utilizați src_postgres
O mică aplicație pentru a filtra vânzările în funcție de companie library(dplyr) library(tidyr) library(DT) company=c("A","L","S","T","W","A","L","S","T","W") sales=c(120,140,160,180,200,120,140,160,180,200) server <- function(input, output)...
215 vederi
schedule 03.08.2022

Cum se aplică summarise_each la toate coloanele, cu excepția uneia? [duplicat]
Analizez un set de date cu multe coloane (aproape 30 de coloane). Vreau să grupez datele pe baza a două coloane și să aplic funcții de sumă și medie tuturor coloanelor, cu excepția marcajului de timp. Cum aș folosi summarise_each pe toate coloanele,...
9609 vederi
schedule 25.08.2022

Gruparea perechilor de ID unice legate folosind R [duplicat]
Încerc să conectez împreună perechi de ID-uri unice folosind R. Având în vedere exemplul de mai jos, am două ID-uri (aici ID1 și ID2) care indică legătura. Încerc să creez grupuri de rânduri care sunt legate. În acest exemplu, A este legat de B,...
446 vederi
schedule 03.07.2022

Cum pot ggplot un cadru de date îmbinat compus din factori cu o axa x sortată alfabetic?
Am două cadre de date ale națiunilor A și B, unele se potrivesc. Cu rbind() și dplyr::summarise() generez un nou cadru de date cu numărul fiecărei țări. Pentru a ggplot() cu axa x sortată alfabetic, sortez cadrul de date după țară cu order()...
181 vederi
schedule 18.07.2022

găsiți valoarea cea mai apropiată de x după grup în dplyr [duplicat]
library(dplyr) a <- data_frame(id = c("A","A","A","B","B","B"), b = c(1.2, 1.5, 1.8, 1.1, 1.6, 1.4)) Acum, aș dori să recuperez valorile cele mai apropiate de 1,43 pentru fiecare dintre categoriile din id. Am crezut că aș...
8553 vederi
schedule 07.08.2022

Adăugați index de ordine de sortare pentru date.tables sortate manual [duplicat]
Am un data.table sau un data.frame library(data.table) DT <- data.table(id = 1:9, name= rep(c('b','a','c'), each = 3)) unde coloana name este ordonată manual, dar întotdeauna grupată. Cum pot calcula name_order coloana pentru a obține...
69 vederi
schedule 09.07.2022

Nu pot înțelege eroarea full_join: atribute de diferite dimensiuni
Am întâlnit o eroare pe care nu am mai văzut-o până acum și o căutare destul de extinsă pe google/SO/listă de corespondență a apărut goală. Când folosesc full_join într-o buclă for, primesc următoarea eroare după ce 75% din iterațiile buclei for...
630 vederi
schedule 24.07.2022

Înlocuiți un subset al unui cadru de date cu operațiuni de unire dplyr
Să presupunem că am dat un tratament unor valori de coloană ale unui cadru de date ca acesta: id animal weight height ... 1 dog 23.0 2 cat NA 3 duck 1.2 4 fairy 0.2 5 snake BAD df <- data.frame(id =...
4627 vederi
schedule 09.08.2022

r agregați și prăbușiți mai multe celule într-una singură
Am un cadru de date: x <- data.frame(id = 1:18, super = c(rep("A", 12), rep("B", 6)), category = c(rep("one", 6), rep("two", 6), rep("three", 6)), root = sort(rep(letters[1:6], 3)),...
416 vederi
schedule 14.08.2022