Întrebări înrudite 'data.table'

rolling joins data.table in R
Încerc să înțeleg puțin mai multe despre modul în care funcționează îmbinările rulante și am o oarecare confuzie, speram că cineva ar putea clarifica acest lucru pentru mine. Pentru a lua un exemplu concret: dt1 <- data.table(id=rep(1:5, 10),...
13802 vederi
schedule 26.10.2022

Transmite numele coloanei în data.table folosind variabila [duplicat]
Posibil duplicat: Variabil selectarea/alocarea câmpurilor dintr-un tabel de date În exemplul următor, creez un tabel de date având numele de coloană „x” și „v” library('data.table') DT <- data.table(x = c("b","b","b","a","a"), v...
99758 vederi
schedule 05.09.2022

R date.tabel replicare eficientă pe grup
Am câteva probleme de alocare a memoriei încercând să reproduc unele date pe grupuri folosind data.table și rep. Iată câteva exemple de date: ob1 <-...
1003 vederi
schedule 10.11.2022

Alăturați-vă R data.tables unde valorile cheilor nu sunt exact egale - combinați rândurile cu cele mai apropiate timpi
Există o modalitate inteligentă de a se alătura tabelelor de date în R unde valorile cheie ale timpului sunt apropiate, dar nu exact aceleași? De exemplu, să presupunem că am un tabel de date cu rezultate care sunt date pentru diferite perioade de...
5156 vederi
schedule 19.12.2023

R date.tabel cu rollapply
Există un mod existent pentru calcularea statisticilor rulante folosind gruparea data.table? De exemplu, având în vedere următorul cod: DT = data.table(x=rep(c("a","b","c"),each=2), y=c(1,3), v=1:6) setkey(DT, y) stat.ror <-...
1884 vederi
schedule 05.02.2024

Factori goali în de date.table
Am un data.table care are o coloană de factori cu niveluri goale. Trebuie să obțin numărul de rânduri și sumele altor variabile, toate grupate după mai mulți factori, inclusiv cel cu niveluri goale. Întrebarea mea este similară cu aceasta una , dar...
2648 vederi
schedule 07.10.2023

Accelerează grupul de date.table prin utilizarea mai multor nuclee și programare paralelă
Am un cod mare și pasul de agregare este blocajul actual în ceea ce privește viteza. În codul meu, aș dori să accelerez etapa de grupare a datelor pentru a fi mai rapidă. Un SNOTE (exemplu simplu non-trivial) al datelor mele arată astfel:...
8800 vederi
schedule 03.02.2024

folosind lm(my_formula) în [.data.table's j
Mi-am luat obiceiul să accesez coloanele data.table în j chiar și atunci când nu am nevoie să: require(data.table) set.seed(1); n = 10 DT <- data.table(x=rnorm(n),y=rnorm(n)) frm <- formula(x~y) DT[,lm(x~y)] # 1 works...
2838 vederi
schedule 04.10.2022

Subsetarea datelor.tabel cu o condiție
Cum se eșantionează un subeșantion de data.table mare (pachet data.table )? Există o modalitate mai elegantă de a efectua următoarele DT<- data.table(cbind(site = rep(letters[1:2], 1000), value = runif(2000)))...
3167 vederi
schedule 02.12.2023

data.table vs dplyr: poate unul face ceva bine celălalt nu poate sau face prost?
Prezentare generală Sunt relativ familiarizat cu data.table , nu atât de mult cu dplyr . Am citit câteva dplyr vignete și exemple care au apărut pe SO și, până acum, concluziile sunt ca: data.table și dplyr sunt comparabile ca...
141416 vederi
schedule 29.11.2023

R: Folosind Delt lui quantmod într-un tabel de date
Urmând R data.table Return calcul și set() aș dori să întreb cum pot folosi Delt() din library(quantmod) pentru a găsi rezultate pentru o serie cronologică într-un data.table() . Până acum, mulțumită lui Frank, am: set.seed(42) DT <-...
1010 vederi
schedule 08.07.2022

Cum să evitați o eroare ciudată de umlaute atunci când utilizați data.table
Trebuie să operez sume pe un cadru de date rar, având în vedere ID-urile require(data.table) sentEx = structure(list(abend = c(1, 1, 0, 0, 2), aber = c(0, 1, 0, 0, 0), über = c(1, 0, 0, 0, 0), überall = c(0, 0, 0, 0, 0), überlegt = c(0, 0, 0, 0,...
593 vederi
schedule 24.02.2024

Despre GForce în date.tabelul 1.9.2
Nu știu cum să profit mare de GForce în date.tabelul 1.9.2 Noua optimizare: GForce. În loc să grupeze datele, locațiile grupului sunt trecute în versiuni grupate de sum și mean (gsum și gmean) care apoi calculează rezultatul pentru toate...
2580 vederi
schedule 18.10.2023

Cum se calculează o statistică rulantă în R folosind data.table pe date spațiate neuniform
Am un set de date indexat după două variabile ID (una imbricată în cealaltă) și dată și doresc să calculez o statistică de rulare în aceste date. Setul meu de date real este mare (~ 200 mil rânduri) și m-am bucurat de creșterea vitezei folosind...
878 vederi
schedule 06.10.2023

Nivelurile cadrelor de date afectează exportul unui set de date din R?
Am 2142 de rânduri și 9 coloane în cadrul de date. Când sun head(df), cadrul de date apare bine, ceva ca mai jos: Local Identifier Local System Parent ID Storage Type Capacity Movable? Storage Unit Order Number 2209 NEZ0037-76 FreezerWorks...
72 vederi
schedule 19.10.2022

Încărcarea datelor din fișierele RData într-un singur tabel de date
Încerc să încarc date din cadru de date obiecte ale toate .RData fișierelor dintr-un director specificat într-un un singur tabel de date . Iată cum am încercat să fac asta: library(data.table) fileList <-...
6135 vederi
schedule 17.12.2023

Completarea coloanei index în data.table
Această întrebare este legată de: Adăugați o coloană la un cadru de date care indexează numărul de apariții dintr-un grup Am următoarele date.table sortate după primele 2 coloane. ddt = structure(list(Unit = structure(c(1L, 1L, 2L, 2L, 3L, 3L),...
163 vederi
schedule 01.11.2023

Tabele de îmbinare condiționată cu mai multe condiții (continuare)
Aceasta este continuarea întrebării Tabelele de îmbinare condiționate Am 2 tabele: Time X1 Class 8/1/2013 56 B 8/1/2013 24 A 9/1/2013 14 A 9/1/2013 46 B 10/1/2013 8 A 10/1/2013 45 A 11/1/2013 4...
84 vederi
schedule 29.01.2024

Buclă peste un rând de date.table cu condiție
Am un tabel de date care conține ID-uri și locații. de exemplu, iată-l cu un rând în el: (are nume de col și rând, nu știu dacă contează) locations<-data.table(c(11,12),c(-159.58,0.2),c(21.901,22.221))...
12139 vederi
schedule 07.11.2022

R adaugă coloane prin buclă în tabelul de date
Am un tabel de date ca acesta: DT <- data.table(ID=rep(c(1:2),each=6), year=rep(c(2003:2006),each=3), month=rep(c(5:8),3), day=rep(c(11:14),3),value=c(101:112)) Și aș dori să adaug coloane cu condițiile: 1, adăugați 5 coloane cu nume:...
1626 vederi
schedule 28.11.2023