Publicații conexe 'dplyr'


R la Python: un ghid pentru recrearea conexiunilor convenabile ale Dplyr în Python
Introducere Dacă sunteți unul dintre mulți utilizatori R care fac trecerea la python, s-ar putea să vă aflați în funcție de comoditatea unora dintre cele mai îndrăgite biblioteci ale lui R. La suprafață, saltul de la comoditatea și simplitatea lui R poate părea puțin descurajantă, deoarece peisajul python, deși amplu, poate produce adesea ceea ce par prea multe traduceri pentru o anumită piesă de funcționalitate. Nu este întotdeauna ușor să găsești traduceri directe. Scopul acestui..

Întrebări înrudite 'dplyr'

data.table vs dplyr: poate unul face ceva bine celălalt nu poate sau face prost?
Prezentare generală Sunt relativ familiarizat cu data.table , nu atât de mult cu dplyr . Am citit câteva dplyr vignete și exemple care au apărut pe SO și, până acum, concluziile sunt ca: data.table și dplyr sunt comparabile ca...
141416 vederi
schedule 29.11.2023

Există o metodă R dplyr pentru îmbinare cu all=TRUE?
Am două cadre de date R pe care vreau să le îmbin. În dreapta R poți face: cost <- data.frame(farm=c('farm A', 'office'), cost=c(10, 100)) trees <- data.frame(farm=c('farm A', 'farm B'), trees=c(20,30)) merge(cost, trees, all=TRUE)...
26038 vederi
schedule 16.11.2023

Numărați numărul de rânduri în funcție de grup folosind dplyr
Folosesc setul de date mtcars . Vreau să găsesc numărul de înregistrări pentru o anumită combinație de date. Ceva foarte asemănător cu clauza count(*) group by din SQL. ddply() de la plyr funcționează pentru mine library(plyr)...
145857 vederi
schedule 06.12.2023

dplyr group_by și funcțiile cummean
Mă așteptam ca codul de mai jos să scoată un cadru de date cu trei rânduri, fiecare rând reprezentând valoarea medie cumulativă a mpg după calcularea mediei pentru fiecare grup de cyl : library(dplyr) mtcars %>% arrange(cyl) %>%...
2901 vederi
schedule 25.08.2022

grupuri suprapuse în dplyr
Încerc să calculez statistici rezumative „în rulare” pe baza unui factor de grupare. Există o modalitate frumoasă de a procesa prin grupuri (suprapuse), bazată pe (să zicem) un factor ordonat? De exemplu, să spunem că vreau să calculez suma lui...
1055 vederi
schedule 31.01.2024

R / dplyr: Cum să utilizați funcțiile de filtrare împreună cu operatorul de pipelining %›%?
Sunt sigur că există o expresie pentru a face acest lucru, dar cum anume canalizez o mască booleană sau o selecție de rând la o operație de filtrare folosind dplyr. De exemplu, aici vreau să selectez rândurile de foo pentru care id-ul este...
799 vederi
schedule 11.08.2022

Ce înseamnă funcția %›% în R?
Am văzut utilizarea funcției %>% (procent mai mare decât procent) în unele pachete precum dplyr și rvest . Ce înseamnă? Este o modalitate de a scrie blocuri de închidere în R?
377969 vederi
schedule 11.07.2022

Conversia / traducerea SQL în dplyr Left Join cu mai multe criterii
Iată configurația (nu este chiar atât de complicat...): Tabelul JobTitle | PersonID | JobTitle | StartDate | EndDate | |----------|----------|-----------|---------| | A | A1 | 1 | 5 | | A | A2 | 6...
815 vederi
schedule 19.07.2022

utilizați %›% cu funcții de înlocuire precum colnames()‹-
Cum pot folosi operatorul de țeavă pentru a ține în funcția de înlocuire precum colnames()<- ? Iată ce încerc să fac: library(dplyr) averages_df <- group_by(mtcars, cyl) %>% summarise(mean(disp), mean(hp)) colnames(averages_df)...
48050 vederi
schedule 01.01.2024

Cum se transmite numele coloanei ca parametru pentru a funcționa în dplyr?
Vreau să fac același lucru ca aici dar cu dplyr si inca o coloana. Vreau să selectez o coloană printr-o variabilă șir, dar deasupra vreau să selectez și oa doua coloană în mod normal. Am nevoie de asta pentru că am o funcție care selectează...
5022 vederi
schedule 17.09.2022

summarise_each pentru două variabile
Am un cadru de date care arată cam așa: df <- data.frame( text = c(1:12), person = c(c(rep("John", 6)), c(rep("Jane", 6))), lemma = c("he", "he", "he", "his", "it", "she", "he", "she", "she", "his", "it", "she"), n =...
329 vederi
schedule 16.11.2023

R: dplyr - Redenumiți numele coloanei după poziție în loc de nume
Vreau să știu dacă există o modalitate de a redenumi numele coloanei după poziția coloanei, mai degrabă decât să le schimb după numele coloanei. Fragmentul de mai jos arată cum să schimbați după nume....
11705 vederi
schedule 11.12.2023

Utilizarea funcțiilor cu dplyr pentru a analiza datele
Am cod în R care manipulează marcajele de timp cu dyplr. Codul este mai jos. În esență, trimitem un e-mail la o anumită oră și primim un răspuns - dacă este cazul. Am vrut să extrag o serie de atribute atât din elementele trimise, cât și din cele de...
393 vederi
schedule 31.01.2024

dplyr crash când se utilizează calculul diferențelor întârziate
Am un cadru de date de 4 milioane de rânduri și 1,4 milioane de valori distincte ale unei variabile de grupare. Exemplul DF arată astfel: > df date id 1 2015-06-25 4333864 2 2015-06-25 3867895 3 2015-06-25 4333866 4...
105 vederi
schedule 18.09.2022

Păstrați rândurile până la prima apariție a unei valori într-o coloană, pe grup. Grupuri fără valoare permise
Am un cadru de date ca acesta: > df id type 1 1 a 2 1 a 3 1 b 4 1 a 5 1 b 6 2 a 7 2 a 8 2 b 9 3 a 10 3 a Vreau să păstrez toate rândurile pentru fiecare grup (id) până la prima apariție a valorii...
2146 vederi
schedule 10.08.2022

R dplyr Condiție bazată pe rezumat
Am un set de date de articole descărcate de pe un site web pe baza rapoartelor pe care le generăm. Ideea este de a elimina rapoartele care nu mai sunt necesare în funcție de numărul de descărcări. Logica este, practic, să numărați toate rapoartele...
1456 vederi
schedule 27.10.2022

Creați mai multe rânduri condiționate și adăugați valori specifice dintr-un alt cadru de date
Bună ziua, Încerc să adaug noi rânduri pe un cadru de date în care am date pentru mai multe surse. Ceea ce încerc să fac este să adaug un nou rând la începutul unei surse și să înlocuiesc valorile coloanei cu valori specifice dintr-un alt tabel....
125 vederi
schedule 12.12.2023

extinde cadrele de date în cadrul cadrului de date
Am un cadru de date cu următoarea structură: language subID sessionID rdm (chr) (fctr) (fctr) (chr) 1 Dutch 13602 13257 <data.frame [676,3]> 2 Dutch 13602 125354 <data.frame...
912 vederi
schedule 06.07.2022

R efectuează calcule pe grupuri pentru subset de rânduri
Cu alte cuvinte, vreau să grupez pe o coloană și apoi să efectuez calcule folosind doar câteva dintre rândurile per grup. Setul de date pe care îl am este: LoanRefId Tran_Type TransactionAmount 103 11...
1041 vederi
schedule 26.11.2023

Distanță și cluster cu deformare dinamică a timpului
Folosesc dtw pentru a calcula distanțele dintre mai multe serii și obțin rezultate ciudate. Observați că în eșantionul de date de mai jos primii 9 clienți sunt seturi identice (A==B==C, D==E==F și G==H==I). Rândurile rămase sunt doar pentru zgomot...
578 vederi