Regressiya tahlili parametrik va parametrik bo'lmagan regressiya deb ikki guruhga bo'linadi. Parametrik regressiya tahlilining eng muhim xususiyati shundaki, o‘zgaruvchilar o‘rtasidagi bog‘liqlik funksiya orqali tushuntirilishi mumkin. Shuningdek; Parametrik regressiyada ba'zi muhim taxminlar amalga oshirilishi kerak. Siz ushbu taxminlar va parametrik regressiya tahlilini qo'llagan ilovalarimga quyidagi havolalardan kirishingiz mumkin:

  • "R ilovalari - 1-qism: oddiy chiziqli regressiya"
  • "R ilovalari - 2-qism: Ko'p chiziqli regressiya"

Agar taxminlar taqdim etilmagan bo'lsa, ma'lumotlar to'plamidagi o'zgaruvchilarga ba'zi tuzatish choralarini ko'rish kerak. Shunday qilib, zarur taxminlar taqdim etilganligi sababli, ular hisob-kitoblarda ishlatilishi mumkin.

Parametrik bo'lmagan regressiya tahlilida funktsiya oldindan belgilanmagan va parametrik regressiya tahlilidagi kabi muhim taxminlar mavjud emas. Parametrik bo'lmagan regressiyada qo'llaniladigan asosiy baholash usullari tekislashga asoslangan. Shu sababli parametrik bo'lmagan regressiya usullari silliqroq deb ham ataladi.

Parametrik bo'lmagan regressiyada qo'llaniladigan ba'zi baholash usullari tekislash printsipiga asoslanadi. Yumshatishning asosiy g'oyasi mahalliy og'irlikdagi o'rtacha qiymatdan foydalanish bo'lib, ma'lum bir nuqtadagi qaram o'zgaruvchining taxminiy qiymati x ning qo'shnisidagi nuqtalarning o'rtacha og'irligini olish yo'li bilan aniqlanadi. Parametrik bo'lmagan regressiyada mahalliy og'irlikdagi o'rtachani topish uchun ishlatiladigan usullar mavjud.

Parametrik bo'lmagan regressiya usullarini elementlarga kiritamiz:

  1. Yadro silliqlash
  2. Mahalliy vaznli tarqalish chizmasini tekislash (PASAT)
  3. Yugurish oralig'ini yumshatish (RIS)
  4. Cheklangan B-Spline Smoothing (COBS)

1. Yadroni tekislash

Kernel Smoothing-da og'irliklar yadro funktsiyasi bilan belgilanadi. Ushbu yadro funktsiyalari; Epanechnikov, ikki vaznli, uchburchak, Gauss va bir xil. Ushbu funktsiyalarning grafiklari quyida ko'rsatilgan.

Kernel Smoothing-da eng ko'p afzal qilingan funksiya Epanechnikov yadro funktsiyasidir. Yadro silliqlash uchun R “WRS2” paketida “kerreg” funksiyasidan foydalanish mumkin. Keling, ushbu usulni ma'lumotlar to'plamida qo'llaymiz:

Sockett va boshqalar. (1987) diabet tashxisi qo'yilgan bolalarda qoldiq insulin sekretsiyasi bilan bog'liq ma'lumotlar haqida hisobot beradi. Tadqiqotning bir qismi diagnostikada C-peptid kontsentratsiyasining logarifmini taxmin qilish uchun yoshdan foydalanish mumkinmi yoki yo'qligi bilan bog'liq:

age<-c(5.2,8.8,10.5,10.6,10.4,1.8,12.7,15.6,5.8,1.9,2.2,4.8,7.9,5.2,0.9,
 11.8,7.9,1.5,10.6,8.5,11.1,12.8,11.3,1.0,14.5,11.9,8.1,13.8,15.5,9.8,11.0,
 12.4,11.1,5.1,4.8,4.2,6.9,13.2,9.9,12.5,13.2,8.9,10.8)
c_peptide<-c(4.8,4.1,5.2,5.5,5.0,3.4,3.4,4.9,5.6,3.7,3.9,4.5,4.8,4.9,3.0,
 4.6,4.8,5.5,4.5,5.3,4.7,6.6,5.1,3.9,5.7,5.1,5.2,3.7,4.9,4.8,4.4,5.2,5.1,4.6,
 3.9,5.1,5.1,6.0,4.9,4.1,4.6,4.9,5.1)
plot(age,c_peptide,xlab = “AGE”,ylab = “C-PEPTIDE”, pch=”*”)

Endi epanechnikov yadro funktsiyasini qo'llash orqali o'zgaruvchilar o'rtasidagi munosabatni ko'rib chiqamiz:

kerreg(age,c_peptide,pch=”*”,expand = 0.5)

Shunday qilib, biz Kernel Smoothing yordamida o'zgaruvchilar o'rtasidagi munosabatni modellashtirdik. "Kengaytirish" parametri tarmoqli kengligini ko'rsatadi. Agar biz ushbu grafikni talqin qilsak, agar yosh 7 yoshdan past bo'lsa, yosh va c-peptid darajalari o'rtasida ijobiy bog'liqlik borligini va 7 dan yuqori bo'lganida hech qanday munosabat yoki kichik munosabatlar mavjudligini aytish mumkin.

2. Mahalliy vaznli scatter chizmasini tekislash (past)

Boshqa parametrik bo'lmagan regressiya usuli - LOWESS. Bu usul yadro tekislash kabi tarmoqli kengligi ham mavjud. Biroq, bu erda tarmoqli kengligi "span" deb ataladi. Bundan tashqari, LOWESS usulida darajani aniqlash orqali hisob-kitoblar tuzilishi mumkin. Odatda reyting "2" ga o'rnatilganda yanada ishonchli natijalar beradi. Bundan tashqari, LOWESS usulining boshqa parametrik bo'lmagan regressiya usullaridan farqi shundaki, u 4 ta mustaqil o'zgaruvchi bilan ishlay oladi. LOWESS usuli haqida dastur tuzamiz. Yana; Biz "yosh" va "c-peptid" o'zgaruvchilari o'rtasidagi munosabatni tekshirishimiz mumkin. R da “loess” funksiyasi ishlatiladi:

plot(age,c_peptide,xlab = “AGE”,ylab = “C-PEPTIDE”, pch=”*”)
lo_mod<-loess(c_peptide~age,span=0.75,degree = 2)
orderx<-order(age)
lines(age[orderx],lo_mod$fitted[orderx])

Shunday qilib, biz LOWESS usuli yordamida o'zgaruvchilar orasidagi munosabatni modellashtirdik. Grafikni talqin qilish yadroni tekislash usulida bo'lgani kabi amalga oshirilishi mumkin.

3. Running Interval Smoother (RIS)

RIS usuli x ma'lum bo'lganda y ning joylashuvining shartli o'lchovini baholash bilan shug'ullanadi. Bu baholash uchun ishonchli joylashuv hisoblagichlari qo'llaniladi. Men ishonchli joylashuvni baholovchilar haqida yozgan maqolani quyidagi havoladan topishingiz mumkin:

  • "Joylashuv va simulyatsiyani o'rganishning mustahkam o'lchovi"

Bundan tashqari, RIS usulida LOWESS usulida bo'lgani kabi "span" qiymati ham mavjud. Bu qiymat odatda 0,8 yoki 1 bo'lganda yaxshi natijalar beradi. R da "rungen" funksiyasi "WRS2" paketi ichida ishlatilishi mumkin.

Keling, "yosh" va "c-peptid" o'zgaruvchilari o'rtasidagi munosabatni RIS usuli bilan kesilgan o'rtacha hisoblagich yordamida modellashtiramiz:

rungen(age,c_peptide,est=tmean,fr=1,LP=FALSE,pch=”*”)

Baholovchini “rungen” funksiyasidagi “est” parametri yordamida aniqlash mumkin. Bu erda "tmean" qisqartirilgan o'rtacha uchun ishlatiladi. Shuningdek, span qiymati (fr) 1 sifatida aniqlanadi. Ushbu grafikga qarab, regressiya chizig'i qo'pol ekanligini aytish mumkin. Shu sababli, 2015 yilda Rand Wilcox tomonidan yanada silliq chiziq yaratish uchun muqobil usul taklif qilingan. Muqobil usulga ko'ra, LOWESS bilan birgalikda RIS usulini qo'llash orqali to'g'ri regressiya chizig'ini olishga qaratilgan. Buning uchun “rungen” funksiyasidagi “LP” parametri “TRUE” sifatida belgilanishi kerak:

rungen(age,c_peptide,est=tmean,fr=1,LP=TRUE,pch=”*”)

Rasmda ko'rinib turganidek, silliq regressiya chizig'i olinadi. Agar biz ushbu grafikni tushuntirsak, yosh taxminan 10 dan past bo'lganida, yosh va c-peptid o'rtasida ortib borayotgan bog'liqlik borligini va 10 dan ortiq bo'lsa, hech qanday munosabat yo'qligini talqin qilish mumkin.

RIS usuli turli kvartil qiymatlari bilan ham ishlaydi. 0,1, 0,5 va 0,9 kvartillar yordamida o'zgaruvchilar o'rtasidagi munosabatni modellashtiramiz. Buning uchun "miqdor" hisoblagichidan foydalanish mumkin:

r1<-rungen(age,c_peptide,est=quantile,fr=1,LP=TRUE,pch=”*”,prob=0.1,pyhat = T)
r2<-rungen(age,c_peptide,est=quantile,fr=1,LP=TRUE,pch=”*”,prob=0.5,pyhat = T)
r3<-rungen(age,c_peptide,est=quantile,fr=1,LP=TRUE,pch=”*”,prob=0.9,pyhat = T)
plot(age,c_peptide,xlab = “AGE”,ylab = “C-PEPTIDE”, pch=”*”)
orderx<-order(age)
lines(age[orderx],r1$output)
lines(age[orderx],r2$output)
lines(age[orderx],r3$output)

Shunday qilib, biz 3 xil kvartil qiymatlari bilan regressiya chiziqlarini yaratdik. 0,1 kardil qiymati ma'lumotlar strukturasining pastki qismini tekshirsa, 0,9 kvartil qiymati ma'lumotlar strukturasining yuqori qismini tekshiradi. 0,5 kvartil qiymati ma'lumotlar to'plamining medianasini ko'rsatadi.

4. Cheklangan B-Spline Smoothing (COBS)

Parametrik bo'lmagan regressiyaning yana bir usuli - bu COBS usuli. COBS usuli x ma'lum bo'lganda y ning shartli kvartil qiymatini baholash uchun ishlatiladi. Ushbu baholashni amalga oshirishda "kvantil regressiya" qo'llaniladi. Kvantil regressiya haqida yozgan maqolamga quyidagi havola orqali kirishingiz mumkin:

  • "R ilovalari - 5-qism: Kvantil regressiya"

Bu usul ham boshqa usullar kabi tarmoqli kengligiga ega. Ushbu tarmoqli kengligi bu erda "lambda" qiymati deb ataladi. Bundan tashqari, u turli kvartil qiymatlari bilan ishlashi mumkin. COBS usuli uchun “cobs” funksiyasidan R dagi “cobs” to‘plamida foydalanish mumkin. Keling, COBS usuli yordamida “yosh” va “c-peptid” o‘zgaruvchilari o‘rtasidagi munosabatni modellashtiramiz:

library(cobs)
sbs1<-cobs(age,c_peptide,tau=0.1,lambda = 0)
sbs2<-cobs(age,c_peptide,tau=0.5,lambda = 0)
sbs3<-cobs(age,c_peptide,tau=0.9,lambda = 0)
plot(age,c_peptide,xlab = “AGE”,ylab = “C-PEPTIDE”, pch=”*”)
orderx<-order(age)
lines(age[orderx],sbs1$fitted[orderx])
lines(age[orderx],sbs2$fitted[orderx])
lines(age[orderx],sbs3$fitted[orderx])

Kvartil qiymatlarini “kobs” funksiyasidagi “tau” parametri yordamida aniqlash mumkin. Shunday qilib, biz o'zgaruvchilar o'rtasidagi munosabatni COBS usuli yordamida, turli Kvartil qiymatlari (0,1, 0,5 va 0,9) yordamida modellashtirdik.

XULOSA

Bu erda biz o'zgaruvchilar orasidagi munosabatlar parametrik bo'lmaganda qo'llanilishi kerak bo'lgan usullarga e'tibor qaratdik. Keyingi maqolada ko'rishguncha…

ADABIYOTLAR

  • Dilber B. (2019). Chiziqli bo'lmagan regressiya usullari. Magistrlik dissertatsiyasi, Dokuz Eylül universiteti, Izmir.
  • Sockett, E. B., Daneman, D. Clarson va C. Ehrich, R. M. (1987). Bolalarda I turdagi (insulinga bog'liq) qandli diabetning birinchi yilida qoldiq insulin sekretsiyasiga ta'sir qiluvchi omillar va shakllari. Qandli diabet, 30, 453-459.
  • Tezjon, N. (2009). Tahmine parametrik olmayan regresyon usuliyle yondashuv. Doktorlik dissertatsiyasi, Istanbul universiteti, Istanbul.
  • Wilcox, R. R. (2012). Ijtimoiy va xulq-atvor fanlari uchun zamonaviy statistika. Los-Anjeles: CRC Press.
  • Wilcox, R. R. (2016). Ikki kvantli regressiya silliqlash vositalarini solishtirish. Zamonaviy amaliy statistik usullar jurnali, 5, 62–77.