Powiązane pytania 'data.table'
łączenia kroczące data.table w R
Próbuję zrozumieć trochę więcej na temat działania połączeń tocznych i mam pewne zamieszanie. Miałem nadzieję, że ktoś może mi to wyjaśnić. Aby wziąć konkretny przykład:
dt1 <- data.table(id=rep(1:5, 10), t=1:50, val1=1:50, key="id,t")
dt2...
13802 wyświetlenia
schedule
26.10.2022
Przekaż nazwę kolumny w data.table za pomocą zmiennej [duplikat]
Możliwy duplikat: Zmiennie wybieranie/przypisywanie do pól w data.table
W poniższym przykładzie tworzę tabelę danych o nazwie kolumny „x” i „v”
library('data.table')
DT <- data.table(x = c("b","b","b","a","a"), v = rnorm(5))...
99758 wyświetlenia
schedule
05.09.2022
R data.table wydajna replikacja według grup
Podczas próby replikacji niektórych danych przez grupy przy użyciu data.table i rep występują pewne problemy z alokacją pamięci.
Oto kilka przykładowych danych:
ob1 <-...
1003 wyświetlenia
schedule
10.11.2022
Dołącz do tabel danych R, w których wartości kluczy nie są dokładnie równe — połącz wiersze z najbliższymi czasami
Czy istnieje sprytny sposób łączenia tabel danych w R, w których kluczowe wartości czasu są bliskie, ale nie dokładnie takie same? Załóżmy na przykład, że mam tabelę danych zawierającą wyniki podane dla różnych okresów:
DT1 =...
5156 wyświetlenia
schedule
19.12.2023
R data.table z rollapply
Czy istnieje idiom obliczania statystyk kroczących przy użyciu grupowania data.table?
Na przykład, biorąc pod uwagę następujący kod:
DT = data.table(x=rep(c("a","b","c"),each=2), y=c(1,3), v=1:6)
setkey(DT, y)
stat.ror <- DT[,rollapply(v,...
1884 wyświetlenia
schedule
05.02.2024
Puste czynniki według data.table
Mam tabelę danych zawierającą kolumnę współczynników z pustymi poziomami. Muszę uzyskać liczbę wierszy i sumy innych zmiennych, wszystkie pogrupowane według wielu czynników, w tym tego z pustymi poziomami. Moje pytanie jest podobne do tego jednego...
2648 wyświetlenia
schedule
07.10.2023
Przyspieszenie grupy data.table poprzez wykorzystanie wielu rdzeni i programowanie równoległe
Mam duży kod, a krok agregacji jest obecnym wąskim gardłem pod względem szybkości.
W moim kodzie chciałbym przyspieszyć etap grupowania danych, aby był szybszy. SNOTE (prosty, nietrywialny przykład) moich danych wygląda następująco:...
8800 wyświetlenia
schedule
03.02.2024
używając lm(my_formula) wewnątrz [.data.table's j
Przyzwyczaiłem się uzyskiwać dostęp do kolumn data.table w j , nawet jeśli nie muszę:
require(data.table)
set.seed(1); n = 10
DT <- data.table(x=rnorm(n),y=rnorm(n))
frm <- formula(x~y)
DT[,lm(x~y)] # 1 works
DT[,lm(frm)]...
2838 wyświetlenia
schedule
04.10.2022
Podzbiór data.table za pomocą warunku
Jak pobrać podpróbkę dużej tabeli danych (pakiet data.table )? Czy istnieje bardziej elegancki sposób wykonania następujących czynności
DT<- data.table(cbind(site = rep(letters[1:2], 1000), value = runif(2000)))...
3167 wyświetlenia
schedule
02.12.2023
data.table vs dplyr: czy jeden może zrobić coś dobrze, a drugi nie potrafi lub robi słabo?
Przegląd
Jestem stosunkowo zaznajomiony z data.table , nie za bardzo z dplyr . Przeczytałem kilka dplyr winiet i przykłady, które pojawiły się na SO, i jak dotąd moje wnioski są takie, że:
data.table i dplyr są porównywalne pod...
141416 wyświetlenia
schedule
29.11.2023
R: Używanie Delt quantmod w data.table
Po obliczeniu R data.table Return i set() chciałbym zapytać, jak mogę użyć Delt() from library(quantmod) do znalezienia zwrotów dla serii czasowej w data.table() . Do tej pory dzięki Frankowi mam:
set.seed(42)
DT <- data.table(...
1010 wyświetlenia
schedule
08.07.2022
Jak uniknąć dziwnego błędu umlaute podczas korzystania z data.table
Muszę operować sumami na rzadkiej ramce danych, biorąc pod uwagę identyfikatory
require(data.table)
sentEx = structure(list(abend = c(1, 1, 0, 0, 2), aber = c(0, 1, 0, 0,
0), über = c(1, 0, 0, 0, 0), überall = c(0, 0, 0, 0, 0), überlegt = c(0,...
593 wyświetlenia
schedule
24.02.2024
O GForce w tabeli danych 1.9.2
Nie wiem, jak wykorzystać GForce w data.table 1.9.2
Nowa optymalizacja: GForce. Zamiast grupować dane, lokalizacje grup są przekazywane do zgrupowanych wersji sumy i średniej (gsum i gmean), które następnie obliczają wynik dla wszystkich grup...
2580 wyświetlenia
schedule
18.10.2023
Jak obliczyć kroczącą statystykę w R przy użyciu data.table na nierównomiernie rozmieszczonych danych
Mam zbiór danych indeksowany przez dwie zmienne identyfikacyjne (jedna zagnieżdżona w drugiej) i datę i chcę obliczyć kroczącą statystykę na podstawie tych danych.
Mój prawdziwy zbiór danych jest duży (~200 milionów wierszy) i podobał mi się wzrost...
878 wyświetlenia
schedule
06.10.2023
Czy poziomy ramek danych wpływają na eksport zbioru danych z R?
Mam 2142 wierszy i 9 kolumn w mojej ramce danych. Kiedy wywołuję head(df), ramka danych wygląda dobrze, mniej więcej tak:
Local Identifier Local System Parent ID Storage Type Capacity Movable? Storage Unit Order Number
2209 NEZ0037-76...
72 wyświetlenia
schedule
19.10.2022
Ładowanie danych z plików RData do pojedynczej tabeli danych
Próbuję załadować dane z obiektów ramki danych wszystkich .RData plików w określonym katalogu do pojedynczej tabeli danych . Próbowałem to zrobić w ten sposób:
library(data.table)
fileList <- list.files("../cache/FLOSSmole",...
6135 wyświetlenia
schedule
17.12.2023
Wypełnianie kolumny indeksu w data.table
To pytanie jest powiązane z: Dodaj kolumnę do ramki danych, która indeksuje liczbę wystąpień w grupie Mam następującą tabelę danych posortowaną według pierwszych 2 kolumn.
ddt = structure(list(Unit = structure(c(1L, 1L, 2L, 2L, 3L, 3L), .Label =...
163 wyświetlenia
schedule
01.11.2023
Warunkowe łączenie tabel z większą liczbą warunków (kontynuuj)
To jest kontynuacja pytania Warunkowe łączenie tabel
Mam 2 tabele:
Time X1 Class
8/1/2013 56 B
8/1/2013 24 A
9/1/2013 14 A
9/1/2013 46 B
10/1/2013 8 A
10/1/2013 45 A
11/1/2013 4 B
11/1/2013...
84 wyświetlenia
schedule
29.01.2024
Wykonaj pętlę nad wierszami data.table z warunkiem
Mam tabelę danych, która przechowuje identyfikatory i lokalizacje. na przykład tutaj jest to z jednym wierszem: (ma nazwy kolumn i wierszy, nie wiem, czy to ma znaczenie)
locations<-data.table(c(11,12),c(-159.58,0.2),c(21.901,22.221))...
12139 wyświetlenia
schedule
07.11.2022
R dodaj kolumny według pętli w tabeli danych
Mam taką tabelę danych:
DT <- data.table(ID=rep(c(1:2),each=6), year=rep(c(2003:2006),each=3), month=rep(c(5:8),3), day=rep(c(11:14),3),value=c(101:112))
Chciałbym dodać kolumny z warunkami:
1, dodaj 5 kolumn z nazwami: V100, V102,...
1626 wyświetlenia
schedule
28.11.2023