Tegishli savollar 'data.table'
Katta birlashtirish / Xotirani boshqarish
Men katta va kichikroq faylni birlashtirishga urinayotgan devorga urildim. Menda o'qing ko'p xotirani boshqarish bo'yicha R-da , va uni hal qilishning ekstremal bo'lmagan (64 bitga o'tish, klasterga yuklash va hokazo) usulini topa olmadim. Men...
3389 qarashlar
schedule
04.05.2024
prokat ma'lumotlar.jadvalni R-da birlashtiradi
Rollingning ishga qo'shilish usuli haqida bir oz ko'proq tushunishga harakat qilyapman va biroz chalkashliklarga duch kelmoqdaman, kimdir buni menga aniqlab berishiga umid qilgandim. Aniq misol keltirsak:
dt1 <- data.table(id=rep(1:5, 10),...
13802 qarashlar
schedule
26.10.2022
O'zgaruvchidan foydalanib data.tableda ustun nomini kiriting [duplicate]
Mumkin bo'lgan dublikat: O'zgaruvchan ma'lumotlar.jadval dagi maydonlarni tanlash/tayinlash
Quyidagi misolda men "x" va "v" ustun nomiga ega ma'lumotlar jadvalini yaratyapman.
library('data.table')
DT <- data.table(x =...
99758 qarashlar
schedule
05.09.2022
R data.table guruh bo'yicha samarali replikatsiya
Data.table va rep yordamida ba'zi ma'lumotlarni guruhlarga ko'paytirishga urinayotgan ba'zi xotira ajratish muammolariga duch kelyapman.
Mana bir nechta namunaviy ma'lumotlar:
ob1 <-...
1003 qarashlar
schedule
10.11.2022
R data.tables ga qo'shiling, bu erda kalit qiymatlari bir xil bo'lmaydi - qatorlarni eng yaqin vaqtlar bilan birlashtiring
Vaqtning asosiy qiymatlari yaqin, lekin bir xil emas, R da ma'lumotlar jadvallariga qo'shilishning silliq usuli bormi? Masalan, menda turli vaqtlar uchun berilgan natijalar jadvali bor deylik:
DT1 = data.table(x=rep(c("a","b","c"),each=3),...
5156 qarashlar
schedule
19.12.2023
R data.table rollapply bilan
Data.table grouping yordamida o'zgaruvchan statistikani hisoblash uchun mavjud idioma bormi?
Masalan, quyidagi kod berilgan:
DT = data.table(x=rep(c("a","b","c"),each=2), y=c(1,3), v=1:6)
setkey(DT, y)
stat.ror <- DT[,rollapply(v, width=1,...
1884 qarashlar
schedule
05.02.2024
Data.table bo'yicha bo'sh omillar
Menda bo'sh darajali omil ustuniga ega data.table bor. Men qatorlar sonini va boshqa o'zgaruvchilarning yig'indisini olishim kerak, ularning barchasi bir nechta omillar bo'yicha guruhlangan, jumladan, bo'sh darajali. Mening savolim shunga o'xshash...
2648 qarashlar
schedule
07.10.2023
Bir nechta yadro va parallel dasturlash yordamida ma'lumotlar jadvalini tezlashtiring
Menda katta kod bor va yig'ish bosqichi tezlik bo'yicha joriy darboğazdir.
Mening kodimda tezroq bo'lish uchun ma'lumotlarni guruhlash bosqichini tezlashtirmoqchiman. Mening ma'lumotlarimning SNOTE (oddiy ahamiyatsiz misol) quyidagicha ko'rinadi:...
8800 qarashlar
schedule
03.02.2024
[.data.table ning j ichida lm(my_formula) dan foydalanish
Men j dagi data.table ustunlariga hatto kerak bo'lmaganda ham kirishni odat qilib oldim:
require(data.table)
set.seed(1); n = 10
DT <- data.table(x=rnorm(n),y=rnorm(n))
frm <- formula(x~y)
DT[,lm(x~y)] # 1 works
DT[,lm(frm)]...
2838 qarashlar
schedule
04.10.2022
Ma'lumotlar.jadvalni shart bilan to'ldirish
Katta ma'lumotlar jadvalining ( data.table paketi) kichik namunasini qanday tanlash mumkin? Quyidagilarni bajarishning yanada oqlangan usuli bormi?
DT<- data.table(cbind(site = rep(letters[1:2], 1000), value = runif(2000)))...
3167 qarashlar
schedule
02.12.2023
data.table vs dplyr: biri yaxshi ishni qila oladimi, ikkinchisi qila olmaydi yoki yomon qiladimi?
Umumiy koʻrinish
Men data.table bilan nisbatan tanishman, dplyr bilan unchalik emas. Men ba'zi dplyr vinyetka va SO'da paydo bo'lgan misollarni o'qib chiqdim va hozirgacha mening xulosalar quyidagilar:
data.table va dplyr tezligi...
141416 qarashlar
schedule
29.11.2023
R: Data.tableda quantmodning Delt-dan foydalanish
R data.table Qaytish hisoblash va set() dan keyin men xohlayman data.table() dagi vaqt seriyasining qaytishini topish uchun Delt() dan library(quantmod) dan qanday foydalanishim mumkinligini so'rash uchun. Hozircha, Frankga rahmat, menda:...
1010 qarashlar
schedule
08.07.2022
Data.table dan foydalanganda g'alati umlaute xatosidan qanday qochish kerak
Men identifikatorlarni hisobga olgan holda siyrak dataframeda summalarni ishlatishim kerak
require(data.table)
sentEx = structure(list(abend = c(1, 1, 0, 0, 2), aber = c(0, 1, 0, 0,
0), über = c(1, 0, 0, 0, 0), überall = c(0, 0, 0, 0, 0),...
593 qarashlar
schedule
24.02.2024
Data.table 1.9.2 da GForce haqida
Data.table 1.9.2 da GForce-dan qanday qilib katta foyda olishni bilmayman
Yangi optimallashtirish: GForce. Ma'lumotlarni guruhlash o'rniga, guruh joylashuvi yig'indisi va o'rtacha (gsum va gmean) guruhlangan versiyalariga o'tkaziladi, so'ngra...
2580 qarashlar
schedule
18.10.2023
notekis oraliqda joylashgan ma'lumotlar bo'yicha data.table yordamida R-da aylanma statistikani qanday hisoblash mumkin
Menda ikkita identifikator o'zgaruvchisi (biri ikkinchisida joylashgan) va sana bilan indekslangan ma'lumotlar to'plami bor va men ushbu ma'lumotlarda o'zgaruvchan statistikani hisoblamoqchiman.
Mening haqiqiy ma'lumotlar to'plamim katta (~ 200...
878 qarashlar
schedule
06.10.2023
Data.tableni tezlashtiradigan algoritmik/dasturlash optimallashtirishlari nima? [yopiq]
Men Internetda biroz qidiruv qildim va SO data.table ni nima shunchalik tez qilishiga kirishish yoki tahlil qilishni qidirdim, lekin men juda ko'p (juda foydali) qo'llanmalarni topdim, dasturlashda nima borligini aniqlamadim. (Men data.table...
251 qarashlar
schedule
06.03.2024
Ma'lumotlar doirasi darajalari ma'lumotlar to'plamini R dan eksport qilishga ta'sir qiladimi?
Mening ma'lumotlar ramkamda 2142 satr va 9 ustun bor. Head(df) ni chaqirganimda, ma'lumotlar ramkasi yaxshi ko'rinadi, quyidagi kabi:
Local Identifier Local System Parent ID Storage Type Capacity Movable? Storage Unit Order Number
2209...
72 qarashlar
schedule
19.10.2022
RData fayllaridan ma'lumotlarni yagona ma'lumotlar jadvaliga yuklash
Belgilangan katalogdagi barcha .RData faylning ma’lumotlar ramkasi obyektlaridan ma’lumotlarni bitta ma’lumotlar jadvali ga yuklamoqchiman. Men buni shunday qilishga harakat qildim:
library(data.table)
fileList <-...
6135 qarashlar
schedule
17.12.2023
Data.tableda indeks ustunini to'ldirish
Bu savol quyidagilar bilan bog'liq: Guruhdagi hodisalar sonini indekslaydigan ma'lumotlar ramkasiga ustun qo'shing Menda dastlabki 2 ustun bo'yicha saralangan quyidagi data.table bor.
ddt = structure(list(Unit = structure(c(1L, 1L, 2L, 2L, 3L,...
163 qarashlar
schedule
01.11.2023
Ma'lumotlarning kichik to'plamiga buyruq.jadval: ekvivalent formulalar
Ushbu uchta buyruq bir xil natijani qaytaradi (kuzatishlar kichik to'plami bo'yicha regressiya). Men data.table haqiqatdan ham fonda nima qilishi borasida muhim farqlar bor yoki yo'qligini bilmoqchiman.
suppressMessages(library("data.table"))...
83 qarashlar
schedule
15.03.2024