5 cărți pe care fiecare cercetător de date ar trebui să le citească în 2021

Nu sunteți sigur ce să adăugați la lista dvs. de lectură din 2021? Rămâneți la esențial.

Manualul științei datelor

Această carte ar trebui să fie cu siguranță în raftul fiecărui cercetător de date: conține interviuri cu 25 de cercetători de date din diferite companii, industrii și niveluri de experiență. Vă vor oferi informații valoroase despre cum să vă planificați cariera pe termen lung, pentru ce companii să lucrați, cum să continuați să învățați și cum văd ei că domeniul se schimbă în următorii ani. Această carte adaugă multă valoare și informații utile, mai ales dacă ești începător. Pentru un rezumat mai detaliat, citiți „acest articol cu ​​principalele 10 lecții din carte”.

Ca exercițiu, vă recomand să obțineți câteva dintre cele mai interesante întrebări din carte și să le adresați unui cercetător de date care lucrează într-o companie pentru care doriți cu adevărat să lucrați sau cuiva care lucrează în țara sau regiunea dvs. (ajungeți la ele pe LinkedIn). În acest fel, puteți obține aceeași perspectivă, dar adaptate realității și obiectivelor dvs.

Statistici practice pentru cercetătorii de date

Există două circumstanțe principale în care veți obține valoare din această carte: vii dintr-un mediu tehnic și trebuie să înveți mai multe despre statistică, sau proveniți dintr-un mediu academic și aveți multe cunoștințe teoretice în statistică, dar nu ați avut. l-a folosit în practică foarte des. Cartea vă va ghida prin principalele concepte din statistică, cum ar fi testele t, distribuțiile și învățarea automată și vă va arăta cum funcționează acestea în practică folosind Python și R. Este o carte bună de nivel intermediar care se concentrează pe aplicație, nu pe teorie.

Vă recomand cu căldură să vă jucați cu codul din carte, încercând să reproduceți unele dintre fragmentele de cod și să le modificați pentru a vedea cum vor funcționa.

Inginerie de caracteristici pentru învățarea automată

Ingineria caracteristicilor este, fără îndoială, unul dintre cei mai importanți pași în fluxul de lucru al științei datelor. Odată ce aveți o viziune generală bună asupra fluxului de lucru și a algoritmilor principali, cu siguranță ar trebui să începeți să vă îmbunătățiți abilitățile de inginerie a caracteristicilor. Acest lucru înseamnă practic să stăpânești multe instrumente diferite și când să le folosești, în funcție de datele și obiectivele tale.

Această carte are un amestec bun de teorie, aplicație și intuiție și vă recomand să o citiți în timp ce luați o mulțime de note și apoi să o păstrați alături ca ghid de referință.

Pentru mai multe informații despre ingineria caracteristicilor, poate doriți să verificați „acest articol”.

Cartea de învățare automată cu o sută de pagini

Una dintre cele mai bune cărți pentru a înțelege matematica din spatele algoritmilor principali ML. Explicațiile sunt clare și simple, dar precise. Ar trebui să fie una dintre primele cărți pe care le citiți atunci când vă începeți călătoria în învățarea automată, mai ales dacă sunteți deja familiarizat cu matematica și notația acesteia. Dacă nu sunteți atât de familiarizat cu matematica, poate că ar trebui să vă simțiți mai confortabil cu intuiția algoritmilor, înainte de a explora ea.

Dacă chiar doriți să studiați această carte în detaliu, vă recomand să încercați să implementați algoritmii din ea folosind limbajul de programare la alegere, pentru a vă asigura că vă consolidați cunoștințele.

Gândește-te la Bayes

Odată ce începi să studiezi statisticile, vei citi adesea despre Bayes și anumiți algoritmi bayesieni. Veți mai auzi, după un timp, despre o anumită dezbatere între abordările bayesiene versus frecventiste. Dacă nu cunoașteți diferența dintre cele două abordări, vă invit să urmăriți „videoclipul lui Cassie Kozyrkov”, unde vă învață asta în aproximativ 7 minute, într-un mod foarte intuitiv.

Odată ce înțelegi această diferență, poate fi destul de util să studiezi statisticile bayesiene, pentru a stăpâni algoritmii bayesieni (dintre care unii sunt cu adevărat puternici) și a-i adăuga la arsenalul tău. Vă recomand această carte mai ales dacă aveți experiență în statistică, dar nu ați studiat niciodată în detaliu metodele bayesiene până acum: nu aprofundează prea mult subiectul, dar este suficient de bună pentru a vă oferi puțină intuiție și pentru a vă arăta cum să folosiți bayesianul. statistici cu Python.

Dacă vă place să studiați știința datelor prin cărți, s-ar putea să vă placă și acest articol:



10 cărți pe care oamenii de știință de date ar trebui să le citească în timpul blocării
Dacă lucrați cu date, aceste cărți vă vor ajuta să rămâneți activ și să învățațitowardsdatascience.com”



Simțiți-vă liber să mă contactați pe LinkedIn dacă doriți să discutați mai departe, ar fi o plăcere (sincer).