Publicații conexe 'pandas'
Elementele de bază ale Pandas pentru analiza datelor [partea 1]
Dacă sunteți nou în analiza datelor sau în știința datelor în general, ca mine, probabil că ați auzit sau citit deja undeva despre ceva numit Pandas.
Pandas este o bibliotecă open-source Python folosită pentru a stoca, crea și analiza date. Are câteva instrumente grozave și cu adevărat utile care vă ajută să vă manipulați datele în mod corect.
În acest articol, voi încerca să prezint elementele de bază ale lui Pandas. Scopul meu este să dau o idee despre cum este să lucrezi cu această..
Convertirea listei imbricate într-un cadru de date Pandas
În acest articol, convertesc lista imbricată într-o singură listă. Vom converti lista aplatizată într-un DataFrame. Structura unei liste imbricate arată similară cu aceasta: [[lista 1],[lista 2],[lista3], ..…, [lista n]].
Aceasta face parte din preprocesarea datelor pentru a genera pagina de hartă HTML prezentată mai jos.
Acest articol face parte dintr-o serie.
Partea 1: „Un exemplu simplu de răzuire a mai multor pagini web simultan folosind BeautifulSoup”
Partea 2:..
Vaex: O singură bibliotecă să-i conducă pe toți.
Pandas vs Dask vs Vaex
Te-ai întrebat vreodată câte date poate crea planeta noastră în fiecare zi?
Ei bine, în 2020, această cifră era de 2,5 chintilioane de octeți pe zi.
Există 18 zerouri într-un chintilion. Doar FYI.
Statisticile de creștere a datelor au oferit câteva cifre mari. Și vor deveni doar mai mari. În calitate de pasionat de date, scopul nostru este să efectuăm întotdeauna un fel de calcul sau procesare pe acestea în cel mai rapid mod posibil. În blogul de..
Diferite tipuri de formate de date CSV, Parquet și Feather
Când facem analize de date sau construim modele pentru predicție cu ajutorul Machine Learning, am întâlnit diferite tipuri de formate de date.
În acest blog vom discuta despre
format CSV Format parchet Format pene
Format CSV:
Formatul standard pentru majoritatea competițiilor tabelare este CSV. CSV înseamnă valori separate prin virgulă. Este folosit pentru a stoca valorile separate prin virgulă. Este cel mai comun tip de date pentru stocarea diferitelor tipuri de seturi de..
Regresia liniară în Python
În regresia liniară, încercați să construiți un model care vă permite să preziceți valoarea unor date noi, având în vedere datele de antrenament utilizate pentru a vă antrena modelul. Acest lucru va deveni clar pe măsură ce lucrăm prin această postare.
Mai sus, putem vedea ecuația de regresie liniară simplă. Variabila y este considerată răspunsul nostru sau variabila dependentă. Acesta este ceea ce intenționăm să prezicem, de exemplu, Vânzări este o alegere populară.
B0 este..
Instrucțiunea dinamică MySQL CREATE TABLE cu panda și pyodbc
Ați fost nevoit vreodată să scrieți manual o declarație masivă CREATE TABLE ? Una cu zeci de coloane? Poate câteva zeci de coloane? Există probabil câteva instrumente GUI care să ajute cu comenzile mari CREATE TABLE . Sau alte tipuri de software drag-n-drop cu care nu sunt familiarizat. Ce se întâmplă dacă ai putea scrie câteva rânduri de cod Python și ai avea grijă de o declarație CREATE TABLE uriașă cu mult mai puțin efort decât tastarea manual ? Interesat? Continuați să..
Lista de top a metodelor rapide cu panda
„Știința datelor”
Lista de top a metodelor rapide cu panda
Economisiți timp cu aceste trucuri utile
După 3 luni de învățare zilnică a lui Pandas, aceștia sunt algoritmul de top pe care îl puteți folosi pentru o editare rapidă, dar semnificativă, fără a vă pierde răbdarea. Dacă ești un expert, s-ar putea să le cunoști deja pe toate, dar dacă ești un începător , acestea îți vor fi foarte utile.
Permiteți-mi să încep prin a crea un set de date pe care îl voi edita în multe moduri..