Mahsulotga asoslangan, elektron tijorat yoki media kompaniyasida ishlayotganingizda, jalb qilingan raqamlardan qoniqmasligingiz mumkin. Agar siz narxni oshirsangiz yoki foydalanuvchi interfeysini o'zgartirsangiz, mijozlar qanday javob berishini baholashni xohlashingiz mumkin. Ko'p odamlar ko'pincha o'z mijozlarini bilishlariga ishonishadi, lekin hamma narsa ular kutgandek bo'lmaydi. A/B testi - bu korxonalar qaysi biri eng yaxshi natija berishini ko'rish uchun bir vaqtning o'zida bir nechta xususiyatlarni sinab ko'rish usulidir. Biz ushbu postda A/B testi nima ekanligini va uni qanday amalga oshirishni ko‘rib chiqamiz.

A/B testi nima?

A/B testi ikki yoki undan ortiq versiyalarni/xususiyatlarni solishtirishga qaratilgan statistik yondashuv bo‘lib, nafaqat qaysi biri yaxshiroq ishlashini, balki farq statistik jihatdan ahamiyatli ekanligini ham baholashga imkon beradi.

A/B testidan turli maqsadlarda foydalanish mumkin, jumladan:

  • Xabarlar va marketing kampaniyalarining dizaynini takomillashtirish
  • Foydalanuvchi tajribasini yaxshilash orqali konversiya tezligini oshiring
  • Veb-sahifalar, reklamalar va boshqalar kabi aktivlarni optimallashtirishda foydalanuvchi ishtirokini hisobga oling

Nima uchun A/B testi muhim?

Tajriba yoki A/B testini o'tkazayotganda siz yangi narsalarni kashf qilishingiz mumkin va natijalar juda kamtar bo'lishi mumkin. Kompaniyalar tez-tez o'z mijozlarini tushunadi deb o'ylash muammosiga duch kelishadi, lekin aslida mijozlar o'zlarini siz taxmin qilganingizdan ancha farq qiladi. Natijada, sezgilarga bog'liq emas, balki testlarni o'tkazish juda muhimdir.

Bu masala ancha murakkab va ravon.

  • Barcha foydalanuvchilar bir xil emas: turli yoshdagilar, jinslar, yangi va qaytib kelganlar va hokazo.
  • Foydalanuvchilar veb-saytda turli vaqtlarni o'tkazadilar. Ba'zi odamlar saytga darhol tashrif buyurishadi, boshqalari esa vaqt oladi.
  • Foydalanuvchilar ko'plab yo'llarni bosib o'tishadi. Ular veb-saytda harakat qilishadi, voqea va maqsadni ko'rishdan oldin turli sahifalarga tashrif buyurishadi.
  • Ushbu muhitda A/B testini modellashtirish ko'pincha asl hikoyaning noto'g'ri talqin qilinishiga olib kelishi mumkin.

A/B testining afzalliklari:

  • Tez takrorlash
  • Ma'lumotlarga asoslangan qaror
  • Yaxshilangan foydalanuvchi ishtiroki
  • Daromad va konversiyalarning ortishi
  • Sinovlarni amalga oshirish uchun haqiqiy foydalanuvchilardan foydalanadi

Mashinani o'rganishda A/B testi nima?

A/B test yondashuvidan foydalanib,mashinani o'rganish modellari baholanishi va takomillashtirilishi mumkin. Yondoshuv yangi model mavjud bo'lganidan yaxshiroq yoki yo'qligini aniqlash uchun ishlatilishi mumkin. Ttashkilot nazoratni va shu maqsadda yangi modellarni solishtirish uchun ko'rsatkichni tanlashi kerak.Ushbu ko'rsatkich tarqatish muvaffaqiyatini baholash va ikkalasini farqlash uchun ishlatiladi. Ikkala model ham ma'lumotlar namunasiga bir vaqtning o'zida oldindan belgilangan muddat davomida qo'llanilishi kerak. Foydalanuvchilarning yarmi boshqaruv modelidan, qolgan yarmi esa yangi modeldan foydalanishi kerak.‍

A/B testini bajarish

Keling, A / B testini qanday bajarish kerakligini tushunish uchun bosqichma-bosqich jarayonni ko'rib chiqaylik.

G'oya/ta'rif

Tajriba uchun maqsadni belgilash birinchi bosqichdir. Agar siz B versiyasiga o'tsangiz nima bo'ladi deb o'ylaysiz? Ehtimol siz oshirish haqida o'ylayotgandirsiz:

  • Konvertatsiya darajasi
  • Mahsulotni ro'yxatdan o'tkazish
  • Foydalanuvchini jalb qilish va boshqalar.

Oddiy qilib aytganda, bu test maqsadini yoki oxirigacha erishmoqchi bo'lgan narsangizni belgilashga o'xshaydi.

Mavzu

Mezonlaringizni aniqlaganingizdan so'ng sizga mavzular to'plami kerak bo'ladi. Bu foydalanuvchilar yoki mijozlar guruhi bo'lishi mumkin. Agar sizda yetarli mavzular bo'lmasa, A/B testini o'tkaza olmasligingiz mumkin. Masalan, quyidagi rasmdagi nuqtalar mavzular sonini aks ettiradi.

Tasodifiylashtirish

Biz mavzularni ikki xil guruhga ajratamiz, A va B. Bu 50-50 bo'lishi shart emas. Bu 60-40 yoki 70-30 bo'lishi mumkin. A/B testini o'tkazish uchun kerakli bo'linishni aniqlashingiz kerak. Ushbu tajribada siz qaysi aholini maqsad qilganingizni ham aniqlashingiz kerak bo'ladi - masalan, qidirayotgan foydalanuvchi, tashrif buyurgan foydalanuvchi va h.k.

Endi siz namuna hajmini belgilashingiz kerak. Umumiy formula quyidagicha:

N = 16σ²/δ²

Bu yerga,

s - namunaviy standart og'ish.

d Nazorat va davolash o'rtasidagi farq.

Namuna hajmiga qaror qilganingizdan so'ng,tajriba davomiyligini aniqlashingiz kerak bo'ladi.Odatda, davomiylik taxminan 1–2 hafta. Foydalanuvchilarning mahsulot bilan hafta davomida va dam olish kunlarida qanday munosabatda bo'lishini ko'rish uchun kamida bir hafta tajriba o'tkazishingiz kerak. Nihoyat, tajribani sinab ko'ring.

Natijalar

Ushbu qadam mavzuni A va B variantlarini ochib beradi, natijalarni o'lchaydi va test statistikasini hisoblaydi. Yuqoridagi misolda biz mavzularni ikki guruhga ajratdik. Yashil nuqtalar sub'ektning konvertatsiya tezligini ko'rsatadi; Shunday qilib, A 70% konvertatsiya oldi va B 40% konvertatsiya oldi; Shunday qilib, biz endi natijalarga erishdik.

Gipotezani tekshirish

Endi biz kuzatilgan o'zgarish statistik ahamiyatga ega yoki yo'qligini bilib olamiz. Gipotezani tekshirish - bu statistik metodologiya bo'lib, u namunadagi ma'lumotlardan foydalangan holda statistik parametr yoki xavf taqsimoti haqida xulosa chiqarishni o'z ichiga oladi. Endi yuqoridagi misolni yana bir bor olaylik.

Gipotezani tekshirishni to'rt bosqichga umumlashtirish mumkin:

  1. Gipoteza bayonotlarini ayting.
  2. Muhimlik darajasini belgilang.
  3. Statistik quvvatni o'rnating.
  4. Aniqlanishi mumkin bo'lgan minimal effektni o'rnating.

Haqiqiy dunyoda qadriyatlar ancha yuqori bo'ladi; bu faqat tasvirlash uchun. Biz Ada 70% va Bda 40% foydalanuvchi konvertatsiya darajasiga ega boʻldik. Keling, A va B oʻrtasida haqiqiy farq bor yoki yoʻqligini aniqlash uchun foydalanadigan test statistikamizni koʻrib chiqaylik.

Test statistikasi: (A-B)% = 70–40% = 30%

Demak, bu bizning kuzatilgan farqimiz; Endi savol bu statistik ahamiyatga egami yoki yo'qmi? Demak, bu savolga javob berish uchun, avvalo, 30 foizlik farqA va B oʻrtasidagi haqiqiy farq tufaylimi yoki bu tasodifiy tasodif tufaylimi yoki yoʻqligini aniqlashimiz kerak. .

Natijada, A va B o'rtasidagi har qanday kuzatilgan farq quyidagilarga bog'liq:

  • Nol gipoteza(Ho): Tasodifiy tasodif
  • Muqobil gipoteza(Ha): Haqiqiy farq.

Quyidagi grafikda test qanday ishlashini ko'rishingiz mumkin; bizning holatlarimizda A B dan ko'ra muhimroq edi, bu tajriba B dan yaxshiroq ekanligini ko'rsatdi.

Endi biz muhimlik darajasini ko'rib chiqamiz. Ahamiyat darajasi asosan qaror qabul qilish chegarasidir; pastroq ahamiyatlilik darajasi asosiy va nazorat o‘rtasidagi asosiy farqni ko‘rsatadi.

P-qiymati ikki qiymat o'rtasidagi farq tasodifiy tasodif bilan bog'liq bo'lish ehtimoli. P-qiymati nol gipotezani rad etadi. P-qiymati qanchalik past bo'lsa, Xo'ni tashlab yuborish ehtimoli shunchalik yuqori bo' ladiNatijada siz ko'rgan narsa tasodifiy sodir bo'lmagan. Aksariyat hollarda alfa qiymati taxminan0,05ga teng.

alfa = 0,05; p-qiymati 0,05 dan kam, Ho ni rad eting va Ha xulosa qiling

Endi bizstatistik kuchni o'rnatamiz, bu muqobil gipoteza to'g'ri bo'lsa, ta'sirni aniqlash ehtimoli. Odatda 0,80ga o'rnatiladi.

Nihoyat, siz minimal aniqlanadigan effektni (MDE) o'rnatishingiz kerak. Bu shuni anglatadiki, agar o'zgarish har bir foydalanuvchi uchun kunlik daromaddan kamida1% ko'p bo'lsa, u amaliy ahamiyatga ega. Ushbu maqolada biz gipotezalarni tekshirishning barcha jihatlarini yorita olmaymiz. Shunday qilib, men takliflar beraman.

"Mashinani o'rganish algoritmlarini taqqoslash uchun statistik ahamiyatlilik testlari"

"Gipotezani tekshirish"

"Mashinani o'rganish algoritmlarini solishtirish uchun gipoteza testi"

Yaroqlilik tekshiruvlari

Ushbu bosqichda biz tajribaning aql-idrokini tekshiramiz. Noto'g'ri tajriba noto'g'ri qaror qabul qilishga olib kelishi mumkin. Asboblar ta'siri, tanlovning noto'g'riligi va boshqalar kabi tashqi omillarni qidirib topishingiz mumkin. Masalan,agar siz ta'tilda yoki bir muddat davomida tajriba o'tkazgan bo'lsangiz. iqtisodiy beqarorlik, noto'g'ri qarorlar qabul qilishingiz mumkin.

Harakat/qaror

Yakuniy bosqich - bu tajriba natijalariga asoslanib tanlov qilish. Bu versiyani/xususiyatni yangilash uchun ishlatilishi mumkin.

MLda A/B testini qachon qilish kerak?

A/B testi - bu bitta o'zgaruvchidagi o'zgarish auditoriya yoki foydalanuvchi ishtirokiga qanday ta'sir qilishini aniqlash strategiyasidir. Bu marketing, veb-dizayn, mahsulotni ishlab chiqish va foydalanuvchi tajribasini loyihalashda kampaniyalar va maqsadli konvertatsiya stavkalarini yaxshilash uchun tizimli strategiya. A/B testini o'tkazishingiz mumkin, agar:

  • Qaysi mahsulot yaxshiroq ishlashini solishtirmoqchisiz
  • Qishloq xo'jaligida qaysi tuproq turi urug'larning yaxshi o'sishiga yordam berishini aniqlash
  • Qaysi tajriba foydalanuvchining mahsulot va sotishda eng ko'p ishtirok etganini ko'rish
  • Mahsulot narxini belgilash, qaysi biri yuqori daromad keltiradi yoki qaysi biri ko'proq yangi mijozlarga olib keladi

Keling, haqiqiy dunyo misolini olaylik;

  • Bing A/B testini o'tkazdi, unda ular Bing qidiruv tizimida reklama sarlavhalarini ko'rsatish usulini o'zgartirdilar.
  • Ushbu "kichik tajriba" birgina Qo'shma Shtatlarda daromadning 12% yoki yiliga 100 million dollardan ko'proq o'sishiga olib keldi.

Yangi tovarlar, yangi brending yoki umuman yangi foydalanuvchi tajribasi kabi katta o'zgarishlarni sinab ko'rishda A/B testi samarasiz. Odamlarning muayyan vaziyatlarda boshqacha yo‘l tutishiga sabab bo‘ladigan me’yordan yuqoriroq ishtirokni yoki hissiy javoblarni rag‘batlantiradigan ta’sirlar bo‘lishi mumkin.

Siz qochishingiz kerak bo'lgan umumiy A/B test xatolari

Tashkilotdagi boshqa mutaxassislar bilan o'zaro aloqada bo'lganingizda, ba'zi tushunchalar noto'g'ri tushunilishi mumkin. Ma'lumot olimi sifatida siz boshqalarga ma'lumotlarni qanday qilib to'g'ri ishlashni tushunishga o'rgatish yoki yordam berishni xohlashingiz mumkin. Keling, A/B testidagi eng keng tarqalgan xatolarni ko'rib chiqaylik:

Noto'g'ri gipoteza: Butun eksperiment gipotezaga asoslangan. Nimani o'zgartirish kerak? O'zgarishning sababi nima? Maqsadli ta'sir nima? Va hokazo. Agar siz noto'g'ri gipoteza bilan boshlasangiz, testning muvaffaqiyatli o'tish ehtimoli kamayadi. Keyingi bosqichga o'tishdan oldin gipoteza natijalari to'g'ri ekanligiga ishonch hosil qiling.

Bir vaqtning o'zida bir nechta elementlarni sinab ko'rish: Bu bir nechta ko'rsatkichlar bilan A/B testini yoki turli davolash guruhlari bilan bitta metrikani o'tkazganingizda yuz berishi mumkin. Bir vaqtning o'zida juda ko'p narsalarni sinab ko'rsangiz, qaysi biri muvaffaqiyat yoki muvaffaqiyatsizlikka sabab bo'lganini aniqlash qiyin. Natijada, testlarga ustuvorlik berish muvaffaqiyatli A/B testi uchun juda muhimdir.

Ushbu muammoni bartaraf etish uchun siz barcha ko'rsatkichlarni uchta guruhga bo'lishingiz mumkin. Birinchidan, siz ta'sir qilishni kutayotganlar, keyin ta'sir qilishi mumkin bo'lganlar va nihoyat, ta'sir qilishi mumkin bo'lmaganlar.

Statistikaning ahamiyatiga e'tibor bermaslik: Sinovga bo'lgan munosabatingiz farq qilmaydi. Statistik ahamiyatga ega bo'lishi uchun testdan o'tish yoki muvaffaqiyatsiz bo'lishidan qat'i nazar, butun kursdan o'tishiga ruxsat bering. Bunga e'tibor bermaslik noto'g'ri qaror qabul qilish va mahsulot muvaffaqiyatsizlikka olib kelishi mumkin.

Tasdiqlanmagan: Natijalar toʻgʻri yoki yoʻqligini ikki marta tekshirish juda muhim. Noto'g'ri natijalar olish ehtimoli mavjud bo'lganda sinovlar o'tkazilsa, A/B testi noto'g'ri bo'lishi mumkin.

Xulosa

Kompaniyalar testni o'tkazish va ma'lumotlardan foydalanuvchi tajribasi va ish faoliyatini yaxshilash uchun foydalanishni osonlashtiradi. A/B testi turli texnologiyalar yordamida amalga oshirilishi mumkin, ammo ma'lumot olimi sifatida siz unga kiradigan jihatlarni tushunishingiz kerak.

Sinovni tasdiqlash va uning statistik ahamiyatini ko'rsatish uchun siz statistika bilan ham tanish bo'lishingiz kerak. A/B testi sizning natijalaringizni turli yo'llar bilan yaxshilashga yordam beradi. Umid qilamanki, sizga maqola yoqdi, baxtli tajriba.