Tegishli nashrlar 'dplyr'
R-dan Pythonga: Python-da Dplyr-ning qulay qo'shilishlarini qayta yaratish bo'yicha qo'llanma
Kirish
Agar siz python-ga o'tayotgan ko'plab R foydalanuvchilaridan biri bo'lsangiz, R-ning eng sevimli kutubxonalarining qulayligiga qarab o'zingizni topishingiz mumkin. Tashqi tomondan, R ning qulayligi va soddaligidan sakrash bir oz qo'rqinchli ko'rinishi mumkin, chunki python landshafti ko'p bo'lsa-da, ko'pincha ma'lum bir funktsional qism uchun juda ko'p tarjima kabi tuyulishi mumkin. To'g'ridan-to'g'ri tarjimalarni topish har doim ham oson emas.
Buning maqsadi, ish jarayonini..
Tegishli savollar 'dplyr'
data.table vs dplyr: biri yaxshi ishni qila oladimi, ikkinchisi qila olmaydi yoki yomon qiladimi?
Umumiy koʻrinish
Men data.table bilan nisbatan tanishman, dplyr bilan unchalik emas. Men ba'zi dplyr vinyetka va SO'da paydo bo'lgan misollarni o'qib chiqdim va hozirgacha mening xulosalar quyidagilar:
data.table va dplyr tezligi...
141416 qarashlar
schedule
29.11.2023
All=TRUE bilan birlashtirish uchun R dplyr usuli bormi?
Menda birlashtirmoqchi bo'lgan ikkita R dataframe bor. To'g'ridan-to'g'ri R da siz quyidagilarni qilishingiz mumkin:
cost <- data.frame(farm=c('farm A', 'office'), cost=c(10, 100))
trees <- data.frame(farm=c('farm A', 'farm B'),...
26038 qarashlar
schedule
16.11.2023
dplyr yordamida guruh bo'yicha qatorlar sonini sanash
Men mtcars ma'lumotlar to'plamidan foydalanmoqdaman. Muayyan ma'lumotlar kombinatsiyasi uchun yozuvlar sonini topmoqchiman. SQL-da band bo'yicha count(*) guruhiga juda o'xshash narsa. ddply() dan plyr men uchun ishlaydi
library(plyr)...
145857 qarashlar
schedule
06.12.2023
dplyr group_by va cummean funktsiyalari
Quyidagi kod cyl ning har bir guruhi uchun o'rtachani hisoblab chiqqandan so'ng, har bir qator mpg ning yig'ilgan o'rtacha qiymatini ifodalovchi uchta qatorli ma'lumotlar ramkasini chiqarishini kutgandim:
library(dplyr)
mtcars %>%...
2901 qarashlar
schedule
25.08.2022
dplyrdagi bir-birining ustiga chiqadigan guruhlar
Men guruhlash faktoriga asoslanib, "o'zgaruvchan" umumiy statistikani hisoblashga harakat qilyapman. Buyurtma qilingan omilga asoslangan (aytaylik) guruhlar tomonidan qayta ishlashning yaxshi usuli bormi?
Misol tariqasida, men guruhlar bo'yicha...
1055 qarashlar
schedule
31.01.2024
R / dplyr : Filtr funksiyalarini quvur liniyasi %›% operatori bilan birgalikda qanday ishlatish mumkin?
Ishonchim komilki, buni amalga oshirish uchun idioma bor, lekin dplyr yordamida qanday qilib mantiqiy niqob yoki qator tanlashni filtrlash jarayoniga o'tkazaman.
Misol uchun, bu erda identifikatori takrorlanadigan foo qatorlarini tanlamoqchiman:...
799 qarashlar
schedule
11.08.2022
Satrni ustun nomi sifatida ishlatganda dplyr::arrange(desc()) qanday ishlatiladi?
Qanday qilib dplyr::arrange(dplyr::desc()) dan foydalanishim va satrni ustun nomi sifatida o'tkazishim mumkin?
Bu erda namunaviy ma'lumotlar to'plami:
df <- data.frame(a = 1:3, b = 3:1)
Ishlaydigan misollar:
df %>%...
3141 qarashlar
schedule
18.04.2024
Rda %›% funksiyasi nimani anglatadi?
dplyr %>% (foizdan kattaroq foiz) funksiyasidan foydalanilganini ko'rdim. /strong> va rvest . Bu nima degani? R-da yopish bloklarini yozishning bir usuli bormi?
377969 qarashlar
schedule
11.07.2022
Ustundagi noyob xususiyatlarni o'zgaruvchilar nomlariga ko'chirish va R-dagi o'zgaruvchilarga asl xususiyatlarni soxta kodlash
Quyidagi ma'lumotlar to'plamini qanday qilib soxta kodlash bilan bog'liq muammo bor.
Misol ma'lumotlar, aytaylik dataframe = mydata:
ID | NAMES |
-- | -------------- |
1 | 4444, 333, 456 |
2 | 333 |
3 | 456, 765 |...
92 qarashlar
schedule
18.05.2024
SQL-ni dplyr-ga aylantirish/tarjima Chapga bir nechta mezonlar bilan qo'shiling
Mana sozlash (bu unchalik murakkab emas...):
Jadval Ish unvonlari
| PersonID | JobTitle | StartDate | EndDate |
|----------|----------|-----------|---------|
| A | A1 | 1 | 5 |
| A | A2 | 6 | 10...
815 qarashlar
schedule
19.07.2022
colnames()‹- kabi almashtirish funksiyalari bilan %›% dan foydalaning
colnames()<- kabi almashtirish funktsiyasiga quvur o'tkazish uchun quvur operatoridan qanday foydalanishim mumkin?
Men nima qilmoqchiman:
library(dplyr)
averages_df <-
group_by(mtcars, cyl) %>%
summarise(mean(disp), mean(hp))...
48050 qarashlar
schedule
01.01.2024
Dplyr da ishlash uchun ustun nomini parametr sifatida qanday o'tkazish mumkin?
Men bu yerda xuddi shunday qilishni xohlayman. lekin dplyr va yana bitta ustun bilan.
Men satr o'zgaruvchisi orqali ustunni tanlamoqchiman, lekin yuqorida men ikkinchi ustunni ham odatdagidek tanlamoqchiman. Menga bu kerak, chunki menda...
5022 qarashlar
schedule
17.09.2022
Dplyr ning tbl_df ustunni satr bo'yicha tanlashda kutilmagan xatti-harakatlarni beradi
Ko'pincha, dplyr dasturidan foydalanilganda, men ustun nomini o'z nomi bo'yicha tanlashni xohlayman, bu erda ustun nomi ba'zi o'zgaruvchilarda satr sifatida saqlanadi.
Men buni dplyr bilan amalga oshirishga urinishlar ko'pincha kutilmagan...
952 qarashlar
schedule
04.03.2024
ikkita o'zgaruvchi uchun har biri uchun summarise_each
Menda shunday ko'rinadigan dataframe bor:
df <- data.frame(
text = c(1:12),
person = c(c(rep("John", 6)), c(rep("Jane", 6))),
lemma = c("he", "he", "he", "his", "it", "she", "he",
"she", "she", "his", "it", "she"),
n...
329 qarashlar
schedule
16.11.2023
Dplyr fe'llari yordamida ma'lumotlar to'plamidagi har bir fayl formati uchun nechta qatorni toping
Ma'lumotlar to'plamidagi har bir fayl turi uchun qancha qator borligini topish uchun "group_by" va "summarise" (dplyr paketining bir qismi) dan foydalanishim kerak. Men bu qanday ishlashini tushunishga harakat qilaman, chunki natijani keyinroq boshqa...
37 qarashlar
schedule
02.03.2024
R: dplyr - ustun nomini nom o'rniga pozitsiya bo'yicha qayta nomlash
Ustun nomlarini ustun nomi bo'yicha o'zgartirishdan ko'ra, ustunning joylashuvi bo'yicha qayta nomlashning yo'li bor yoki yo'qligini bilmoqchiman.
Quyida ism bo'yicha qanday o'zgartirish mumkinligi ko'rsatilgan....
11705 qarashlar
schedule
11.12.2023
dplyr bilan ulashda lhs ob'ekt nomini oling
Men dplyr dan eksport qilingan quvur operatoridan foydalanishi mumkin bo'lgan funksiyaga ega bo'lishni xohlayman. Men magrittr dan foydalanmayapman.
df %>% my_function
Qanday qilib df nomini olsam bo'ladi? Agar harakat qilsam...
747 qarashlar
schedule
02.04.2024
Sanalarni tahlil qilish uchun dplyr bilan funktsiyalardan foydalanish
Menda R-da dyplr bilan vaqt belgilarini boshqaradigan kodim bor. Kod quyida keltirilgan. Aslida, biz ma'lum bir vaqtda elektron pochta xabarini jo'natamiz va javob olamiz - agar mavjud bo'lsa. Men yuborilgan va javob elementlaridan bir qator...
393 qarashlar
schedule
31.01.2024
kechikkan farqni hisoblashdan foydalanganda dplyr qulashi
Menda 4 million qatorli ma'lumotlar ramkasi va guruhlash o'zgaruvchisining 1,4 million alohida qiymatlari bor. DF namunasi quyidagicha ko'rinadi:
> df
date id
1 2015-06-25 4333864
2 2015-06-25 3867895
3 2015-06-25 4333866...
105 qarashlar
schedule
18.09.2022
Guruh bo'yicha ustundagi qiymat birinchi marta paydo bo'lgunga qadar qatorlarni saqlang. Qiymatsiz guruhlarga ruxsat beriladi
Menda shunday ma'lumotlar ramkasi bor:
> df
id type
1 1 a
2 1 a
3 1 b
4 1 a
5 1 b
6 2 a
7 2 a
8 2 b
9 3 a
10 3 a
Men har bir guruh (id) uchun barcha qatorlarni tur ustunidagi "b" qiymatining...
2146 qarashlar
schedule
10.08.2022