Powiązane pytania 'data.table'

łączenia kroczące data.table w R
Próbuję zrozumieć trochę więcej na temat działania połączeń tocznych i mam pewne zamieszanie. Miałem nadzieję, że ktoś może mi to wyjaśnić. Aby wziąć konkretny przykład: dt1 <- data.table(id=rep(1:5, 10), t=1:50, val1=1:50, key="id,t") dt2...
13802 wyświetlenia
schedule 26.10.2022

Przekaż nazwę kolumny w data.table za pomocą zmiennej [duplikat]
Możliwy duplikat: Zmiennie wybieranie/przypisywanie do pól w data.table W poniższym przykładzie tworzę tabelę danych o nazwie kolumny „x” i „v” library('data.table') DT <- data.table(x = c("b","b","b","a","a"), v = rnorm(5))...
99758 wyświetlenia
schedule 05.09.2022

R data.table wydajna replikacja według grup
Podczas próby replikacji niektórych danych przez grupy przy użyciu data.table i rep występują pewne problemy z alokacją pamięci. Oto kilka przykładowych danych: ob1 <-...
1003 wyświetlenia
schedule 10.11.2022

Dołącz do tabel danych R, w których wartości kluczy nie są dokładnie równe — połącz wiersze z najbliższymi czasami
Czy istnieje sprytny sposób łączenia tabel danych w R, w których kluczowe wartości czasu są bliskie, ale nie dokładnie takie same? Załóżmy na przykład, że mam tabelę danych zawierającą wyniki podane dla różnych okresów: DT1 =...
5156 wyświetlenia
schedule 19.12.2023

R data.table z rollapply
Czy istnieje idiom obliczania statystyk kroczących przy użyciu grupowania data.table? Na przykład, biorąc pod uwagę następujący kod: DT = data.table(x=rep(c("a","b","c"),each=2), y=c(1,3), v=1:6) setkey(DT, y) stat.ror <- DT[,rollapply(v,...
1884 wyświetlenia
schedule 05.02.2024

Puste czynniki według data.table
Mam tabelę danych zawierającą kolumnę współczynników z pustymi poziomami. Muszę uzyskać liczbę wierszy i sumy innych zmiennych, wszystkie pogrupowane według wielu czynników, w tym tego z pustymi poziomami. Moje pytanie jest podobne do tego jednego...
2648 wyświetlenia
schedule 07.10.2023

Przyspieszenie grupy data.table poprzez wykorzystanie wielu rdzeni i programowanie równoległe
Mam duży kod, a krok agregacji jest obecnym wąskim gardłem pod względem szybkości. W moim kodzie chciałbym przyspieszyć etap grupowania danych, aby był szybszy. SNOTE (prosty, nietrywialny przykład) moich danych wygląda następująco:...
8800 wyświetlenia
schedule 03.02.2024

używając lm(my_formula) wewnątrz [.data.table's j
Przyzwyczaiłem się uzyskiwać dostęp do kolumn data.table w j , nawet jeśli nie muszę: require(data.table) set.seed(1); n = 10 DT <- data.table(x=rnorm(n),y=rnorm(n)) frm <- formula(x~y) DT[,lm(x~y)] # 1 works DT[,lm(frm)]...
2838 wyświetlenia
schedule 04.10.2022

Podzbiór data.table za pomocą warunku
Jak pobrać podpróbkę dużej tabeli danych (pakiet data.table )? Czy istnieje bardziej elegancki sposób wykonania następujących czynności DT<- data.table(cbind(site = rep(letters[1:2], 1000), value = runif(2000)))...
3167 wyświetlenia
schedule 02.12.2023

data.table vs dplyr: czy jeden może zrobić coś dobrze, a drugi nie potrafi lub robi słabo?
Przegląd Jestem stosunkowo zaznajomiony z data.table , nie za bardzo z dplyr . Przeczytałem kilka dplyr winiet i przykłady, które pojawiły się na SO, i jak dotąd moje wnioski są takie, że: data.table i dplyr są porównywalne pod...
141416 wyświetlenia
schedule 29.11.2023

R: Używanie Delt quantmod w data.table
Po obliczeniu R data.table Return i set() chciałbym zapytać, jak mogę użyć Delt() from library(quantmod) do znalezienia zwrotów dla serii czasowej w data.table() . Do tej pory dzięki Frankowi mam: set.seed(42) DT <- data.table(...
1010 wyświetlenia
schedule 08.07.2022

Jak uniknąć dziwnego błędu umlaute podczas korzystania z data.table
Muszę operować sumami na rzadkiej ramce danych, biorąc pod uwagę identyfikatory require(data.table) sentEx = structure(list(abend = c(1, 1, 0, 0, 2), aber = c(0, 1, 0, 0, 0), über = c(1, 0, 0, 0, 0), überall = c(0, 0, 0, 0, 0), überlegt = c(0,...
593 wyświetlenia
schedule 24.02.2024

O GForce w tabeli danych 1.9.2
Nie wiem, jak wykorzystać GForce w data.table 1.9.2 Nowa optymalizacja: GForce. Zamiast grupować dane, lokalizacje grup są przekazywane do zgrupowanych wersji sumy i średniej (gsum i gmean), które następnie obliczają wynik dla wszystkich grup...
2580 wyświetlenia
schedule 18.10.2023

Jak obliczyć kroczącą statystykę w R przy użyciu data.table na nierównomiernie rozmieszczonych danych
Mam zbiór danych indeksowany przez dwie zmienne identyfikacyjne (jedna zagnieżdżona w drugiej) i datę i chcę obliczyć kroczącą statystykę na podstawie tych danych. Mój prawdziwy zbiór danych jest duży (~200 milionów wierszy) i podobał mi się wzrost...
878 wyświetlenia
schedule 06.10.2023

Czy poziomy ramek danych wpływają na eksport zbioru danych z R?
Mam 2142 wierszy i 9 kolumn w mojej ramce danych. Kiedy wywołuję head(df), ramka danych wygląda dobrze, mniej więcej tak: Local Identifier Local System Parent ID Storage Type Capacity Movable? Storage Unit Order Number 2209 NEZ0037-76...
72 wyświetlenia
schedule 19.10.2022

Ładowanie danych z plików RData do pojedynczej tabeli danych
Próbuję załadować dane z obiektów ramki danych wszystkich .RData plików w określonym katalogu do pojedynczej tabeli danych . Próbowałem to zrobić w ten sposób: library(data.table) fileList <- list.files("../cache/FLOSSmole",...
6135 wyświetlenia
schedule 17.12.2023

Wypełnianie kolumny indeksu w data.table
To pytanie jest powiązane z: Dodaj kolumnę do ramki danych, która indeksuje liczbę wystąpień w grupie Mam następującą tabelę danych posortowaną według pierwszych 2 kolumn. ddt = structure(list(Unit = structure(c(1L, 1L, 2L, 2L, 3L, 3L), .Label =...
163 wyświetlenia
schedule 01.11.2023

Warunkowe łączenie tabel z większą liczbą warunków (kontynuuj)
To jest kontynuacja pytania Warunkowe łączenie tabel Mam 2 tabele: Time X1 Class 8/1/2013 56 B 8/1/2013 24 A 9/1/2013 14 A 9/1/2013 46 B 10/1/2013 8 A 10/1/2013 45 A 11/1/2013 4 B 11/1/2013...
84 wyświetlenia
schedule 29.01.2024

Wykonaj pętlę nad wierszami data.table z warunkiem
Mam tabelę danych, która przechowuje identyfikatory i lokalizacje. na przykład tutaj jest to z jednym wierszem: (ma nazwy kolumn i wierszy, nie wiem, czy to ma znaczenie) locations<-data.table(c(11,12),c(-159.58,0.2),c(21.901,22.221))...
12139 wyświetlenia
schedule 07.11.2022

R dodaj kolumny według pętli w tabeli danych
Mam taką tabelę danych: DT <- data.table(ID=rep(c(1:2),each=6), year=rep(c(2003:2006),each=3), month=rep(c(5:8),3), day=rep(c(11:14),3),value=c(101:112)) Chciałbym dodać kolumny z warunkami: 1, dodaj 5 kolumn z nazwami: V100, V102,...
1626 wyświetlenia
schedule 28.11.2023