Publicații conexe 'dplyr'
R la Python: un ghid pentru recrearea conexiunilor convenabile ale Dplyr în Python
Introducere
Dacă sunteți unul dintre mulți utilizatori R care fac trecerea la python, s-ar putea să vă aflați în funcție de comoditatea unora dintre cele mai îndrăgite biblioteci ale lui R. La suprafață, saltul de la comoditatea și simplitatea lui R poate părea puțin descurajantă, deoarece peisajul python, deși amplu, poate produce adesea ceea ce par prea multe traduceri pentru o anumită piesă de funcționalitate. Nu este întotdeauna ușor să găsești traduceri directe.
Scopul acestui..
Întrebări înrudite 'dplyr'
dplyr group_by și funcțiile cummean
Mă așteptam ca codul de mai jos să scoată un cadru de date cu trei rânduri, fiecare rând reprezentând valoarea medie cumulativă a mpg după calcularea mediei pentru fiecare grup de cyl :
library(dplyr)
mtcars %>%
arrange(cyl) %>%...
2901 vederi
schedule
25.08.2022
R / dplyr: Cum să utilizați funcțiile de filtrare împreună cu operatorul de pipelining %›%?
Sunt sigur că există o expresie pentru a face acest lucru, dar cum anume canalizez o mască booleană sau o selecție de rând la o operație de filtrare folosind dplyr.
De exemplu, aici vreau să selectez rândurile de foo pentru care id-ul este...
799 vederi
schedule
11.08.2022
Ce înseamnă funcția %›% în R?
Am văzut utilizarea funcției %>% (procent mai mare decât procent) în unele pachete precum dplyr și rvest . Ce înseamnă? Este o modalitate de a scrie blocuri de închidere în R?
377969 vederi
schedule
11.07.2022
Conversia / traducerea SQL în dplyr Left Join cu mai multe criterii
Iată configurația (nu este chiar atât de complicat...):
Tabelul JobTitle
| PersonID | JobTitle | StartDate | EndDate |
|----------|----------|-----------|---------|
| A | A1 | 1 | 5 |
| A | A2 | 6...
815 vederi
schedule
19.07.2022
Cum se transmite numele coloanei ca parametru pentru a funcționa în dplyr?
Vreau să fac același lucru ca aici dar cu dplyr si inca o coloana.
Vreau să selectez o coloană printr-o variabilă șir, dar deasupra vreau să selectez și oa doua coloană în mod normal. Am nevoie de asta pentru că am o funcție care selectează...
5022 vederi
schedule
17.09.2022
dplyr crash când se utilizează calculul diferențelor întârziate
Am un cadru de date de 4 milioane de rânduri și 1,4 milioane de valori distincte ale unei variabile de grupare. Exemplul DF arată astfel:
> df
date id
1 2015-06-25 4333864
2 2015-06-25 3867895
3 2015-06-25 4333866
4...
105 vederi
schedule
18.09.2022
Păstrați rândurile până la prima apariție a unei valori într-o coloană, pe grup. Grupuri fără valoare permise
Am un cadru de date ca acesta:
> df
id type
1 1 a
2 1 a
3 1 b
4 1 a
5 1 b
6 2 a
7 2 a
8 2 b
9 3 a
10 3 a
Vreau să păstrez toate rândurile pentru fiecare grup (id) până la prima apariție a valorii...
2146 vederi
schedule
10.08.2022
extinde cadrele de date în cadrul cadrului de date
Am un cadru de date cu următoarea structură:
language subID sessionID rdm
(chr) (fctr) (fctr) (chr)
1 Dutch 13602 13257 <data.frame [676,3]>
2 Dutch 13602 125354 <data.frame...
912 vederi
schedule
06.07.2022
Folosind group_by și mutate în pachetul dplyr pentru a crea o nouă variabilă factor după variabila id
Am un cadru de date ierarhic în format lung, unde fiecare rând reprezintă relații, dintre care multe pot aparține unei singure persoane. Iată codul pentru un mic exemplu de set de date:
df <- data.frame(id = as.factor(c(1,1,1,2,2,3,4,4)),...
6313 vederi
schedule
27.09.2022
Pachete cu același nume de funcție
Bibliotecile cu același nume de funcție în R par a fi foarte enervante. Care este cel mai simplu mod de a rezolva probleme precum următoarele?
Attaching package: ‘dplyr’
The following objects are masked from ‘package:stats’:
filter, lag
The...
796 vederi
schedule
12.07.2022
rând de potrivire pentru datele obținute din dplyr summarize_each [duplicat]
Vreau să știu care este Sepal.Length pentru Sepal.Width minim pentru fiecare specie, dar nu îmi pot da seama cum să obțin rândurile potrivite pentru rândul care are Sepal.Width minim.
library(dplyr)
itable <- tbl_df(iris)
#print(itable)
a <-...
49 vederi
schedule
01.07.2022
R Shiny dplyr multi select pentru eroare de filtru atunci când utilizați src_postgres
O mică aplicație pentru a filtra vânzările în funcție de companie
library(dplyr)
library(tidyr)
library(DT)
company=c("A","L","S","T","W","A","L","S","T","W")
sales=c(120,140,160,180,200,120,140,160,180,200)
server <- function(input, output)...
215 vederi
schedule
03.08.2022
Cum se aplică summarise_each la toate coloanele, cu excepția uneia? [duplicat]
Analizez un set de date cu multe coloane (aproape 30 de coloane). Vreau să grupez datele pe baza a două coloane și să aplic funcții de sumă și medie tuturor coloanelor, cu excepția marcajului de timp. Cum aș folosi summarise_each pe toate coloanele,...
9609 vederi
schedule
25.08.2022
Gruparea perechilor de ID unice legate folosind R [duplicat]
Încerc să conectez împreună perechi de ID-uri unice folosind R. Având în vedere exemplul de mai jos, am două ID-uri (aici ID1 și ID2) care indică legătura. Încerc să creez grupuri de rânduri care sunt legate. În acest exemplu, A este legat de B,...
446 vederi
schedule
03.07.2022
Cum pot ggplot un cadru de date îmbinat compus din factori cu o axa x sortată alfabetic?
Am două cadre de date ale națiunilor A și B, unele se potrivesc. Cu rbind() și dplyr::summarise() generez un nou cadru de date cu numărul fiecărei țări. Pentru a ggplot() cu axa x sortată alfabetic, sortez cadrul de date după țară cu order()...
181 vederi
schedule
18.07.2022
găsiți valoarea cea mai apropiată de x după grup în dplyr [duplicat]
library(dplyr)
a <- data_frame(id = c("A","A","A","B","B","B"),
b = c(1.2, 1.5, 1.8, 1.1, 1.6, 1.4))
Acum, aș dori să recuperez valorile cele mai apropiate de 1,43 pentru fiecare dintre categoriile din id. Am crezut că aș...
8553 vederi
schedule
07.08.2022
Adăugați index de ordine de sortare pentru date.tables sortate manual [duplicat]
Am un data.table sau un data.frame
library(data.table)
DT <- data.table(id = 1:9, name= rep(c('b','a','c'), each = 3))
unde coloana name este ordonată manual, dar întotdeauna grupată. Cum pot calcula name_order coloana pentru a obține...
69 vederi
schedule
09.07.2022
Nu pot înțelege eroarea full_join: atribute de diferite dimensiuni
Am întâlnit o eroare pe care nu am mai văzut-o până acum și o căutare destul de extinsă pe google/SO/listă de corespondență a apărut goală.
Când folosesc full_join într-o buclă for, primesc următoarea eroare după ce 75% din iterațiile buclei for...
630 vederi
schedule
24.07.2022
Înlocuiți un subset al unui cadru de date cu operațiuni de unire dplyr
Să presupunem că am dat un tratament unor valori de coloană ale unui cadru de date ca acesta:
id animal weight height ...
1 dog 23.0
2 cat NA
3 duck 1.2
4 fairy 0.2
5 snake BAD
df <- data.frame(id =...
4627 vederi
schedule
09.08.2022
r agregați și prăbușiți mai multe celule într-una singură
Am un cadru de date:
x <- data.frame(id = 1:18,
super = c(rep("A", 12), rep("B", 6)),
category = c(rep("one", 6), rep("two", 6), rep("three", 6)),
root = sort(rep(letters[1:6], 3)),...
416 vederi
schedule
14.08.2022