În calitate de Data Scientist, veți întâlni unele valori care „nu sunt un număr” (Nan) și alte valori care sunt infinite în seturile dvs. de date. Este esențial să știi să le tratăm afectiv. Din fericire, în biblioteca Numpy există câteva funcții care sunt utile în găsirea și tratarea acestor valori.

Instalarea Numpy

Primul lucru pe care trebuie să-l faceți dacă nu aveți Numpy instalat în mediul dvs. Python este să îl instalați folosind următoarea comandă dintr-un prompt de comandă.

pip install numpy

Alternativ, dacă doriți să instalați acest lucru într-un notebook Jupyter, puteți utiliza aceeași comandă, dar cu un semn de exclamare în față pentru a indica lui Jupyter că executați un element de linie de comandă.

Se importă Numpy

Apoi, trebuie să importați biblioteca Numpy în memorie astfel:

Acum puteți apela Numpy doar tastând literele np.

Creați unele variabile

În continuare voi defini câteva variabile pe care să le folosesc ca exemple

1) Numpy.isnan() și 2)Numpy.isfinite()

Primele două funcții Numpy pe care le vom analiza sunt funcția np.isnan() și funcția np.isfinite(). Acestea produc o valoare booleană așa cum se arată în codul de mai jos.

De asemenea, putem folosi aceste funcții pentru liste de articole ca aceasta:

3) Numpy.any() și 4) Numpy.all()

Dacă doriți să testați dacă toate elementele din lista x sunt finite sau nu un număr, puteți utiliza funcția np.all() atât cu funcțiile np.isnan() cât și cu funcțiile np.isfinite().

De asemenea, puteți testa pentru a vedea dacă elementele din lista dvs. sunt finite sau nu sunt un număr folosind funcția np.any() cu np.isnan și np.isfinite().

Până acum am avut de-a face cu numere finite, dar ce se întâmplă dacă ai vrea să creezi unele numere care nu sunt un număr sau finit?

5) Numpy.inf și 6) Numpy.nan

Pentru a crea un număr infinit puteți folosi funcția np.inf. Nu necesită paranteze. De asemenea, puteți crea o valoare Nan folosind funcția np.nan.

Aici am creat o listă de elemente cu câteva numere și un element np.inf și un element np.nan.

Apoi pot folosi funcția np.any(np.isnan()) și funcția np.all(np.isfinite()) din y_list pentru a vedea cum funcționează.

7) Numpy.average()

Pentru a trata în mod afectiv valorile Nan și infinite, puteți fie să le înlocuiți cu zero, valori medii care să nu modifice prea mult distribuția, fie să eliminați toate valorile. Pentru acest set de date nu am vrut să elimin nicio valoare și nu am vrut să înlocuiesc nicio valoare cu zero. În schimb, vreau să fac astfel încât înlocuirea valorilor lipsă, Nan sau infinite să nu modifice media setului de date, astfel încât cel mai bun înlocuitor pentru valorile Nan și infinite este media. În funcție de datele particulare, poate fi necesar să efectuați calcule complexe pentru a completa valorile datelor care sunt infinite sau Nan. Aici înlocuiesc valorile Nan și infinite cu media valorilor non-Nan și non-infinite folosind funcția np.average().

Acum pot folosi aceste valori pentru mai multe activități de Data Science și Machine Learning.

Concluzie

Sper că puteți folosi aceste funcții pentru a vă ajuta în proiectele dvs. de Data Science, Machine Learning și programare pe computer în Python.

Bibliografie web:

Pentru mai multe informații despre aceste și alte funcții Numpy, consultați aceste site-uri web:



numpy.org