Pandas Dataframe Astype: Sintaxă, Tipuri de date, Creare Dataframe

Publicat: 2020-08-28

Python este unul dintre cele mai utilizate limbaje din diverse industrii pentru manipularea și analiza datelor. Cel mai mare motiv din spatele popularității lui Python este setul său vast de biblioteci care simplifică întreținerea și monitorizarea datelor pentru dezvoltatori. O astfel de bibliotecă scrisă pentru Python este Pandas . Biblioteca Pandas , în special, este folosită pentru manipularea seriilor temporale și a tabelelor. Consultați cursurile noastre de știință a datelor pentru a afla mai multe despre panda.

Pandas DataFrame . Metoda astype () sau uneori denumită și astype () este folosită pentru a arunca obiecte panda într-un dtype. funcția astype (). Este deosebit de util atunci când trebuie să convertim tipul de date al uneia sau mai multor coloane ale unui tabel în altul.

Cuprins

Sintaxa lui Pandas DataFrame.astype()

În primul rând, înainte de a discuta despre sintaxă, trebuie să importăm biblioteca Pandas, care se face prin:

importa panda ca pd

Sintaxa pentru DataFrame. metoda astype () este:

DataFrame.astype(dtype, copy=True, errors='raise', **kwargs)

Parametrii

Descriere

Valoare implicită

dtype

Utilizează numpy.dtype sau tipul Python pentru a arunca întregul obiect la același tip. Alternativ, poate folosi {col: dtype, ?} unde col este eticheta coloanei, iar dtype va funcționa la fel pentru a proiecta una sau mai multe dintre coloanele DataFrame în tipuri specifice coloanei.

dtype

copie

Returnează o copie când se setează la True (setarea copy=false poate propaga modificările valorilor către alte obiecte Pandas ).

Adevărat

erori

Controlează excepțiile care apar în cazul datelor nevalide pentru tipul de date dat.

a ridica

kwargs

Argumentele cuvintelor cheie de transmis constructorului.

Returnări : turnate: returnare similară tipului de apelant.

Citiți: Cadre de date în Python

Tipuri de date din biblioteca Pandas

Acum, de la Pandas DataFrame. Metoda astype () este despre turnarea și modificarea tipurilor de date în tabele, să ne uităm la tipurile de date și la utilizarea lor în biblioteca Pandas .

1. Obiect : Folosit pentru valori text sau alfanumerice.

2. Int64 : Folosit pentru numere întregi.

3. Float64 : Folosit pentru numere în virgulă mobilă.

4. Bool : Folosit pentru valorile True/False.

5. Datetime64 : Folosit pentru valori de dată și oră.

6. Timedelta[ns] : Folosit pentru diferențele dintre două date și ore.

7. Categorie : Folosit pentru o listă de valori text.

Crearea unui DataFrame în biblioteca Pandas

Există două moduri de a crea un cadru de date într-un obiect Pandas . Putem fie să creăm un tabel, fie să inserăm un fișier CSV existent. Codul de inserare a unui fișier existent este:

df = pd.read_csv(“ nume_fișier.csv ”)

Sintaxa pentru a crea un nou tabel pentru cadrul de date este:

t = {'col 1': [1, 2], 'col 2': [3, 4]}

df = pd.DataFrame(data=t)

Trebuie citit: Tutorial Python Panda pentru începători

Folosind metoda Pandas Dataframe.astype().

Odată ce avem tabelul și cadrul de date inserate în obiectul panda , putem începe să convertim tipurile de date ale uneia sau mai multor coloane ale tabelului. Putem verifica tipurile de date ale valorilor înainte de a le converti utilizând codul df.dtypes sau df.info() . Ambele coduri vor afișa tipurile de date din fiecare coloană a tabelului.

Un alt lucru de remarcat este că DataFrame. Metoda astype () poate da o eroare dacă cadrul de date are valori nan sau NA. Deci, înainte de a continua, trebuie să ștergem toate valorile nan din tabel. Sintaxa pentru a elimina valorile nan sau NA este:

df.dropna(inplace = True)

Conversia tuturor coloanelor unui cadru de date

Sintaxă: df. astype (' data_type ').dtypes

Tipul de date al întregului cadru de date va fi convertit la valoarea pe care o punem în „ data_type”. '

Conversia unor coloane specifice ale unui cadru de date

Sintaxă: df. astype ({“ col_name ”: ' data_type '}).dtypes

„col_name” aici necesită un nume de coloană ca intrare. Indiferent de numele coloanei pe care l-am introduce, tipul de date al acelei coloane va fi schimbat la valoarea pe care o oferim în „ data_type”.

Conversia mai multor coloane simultan

Sintaxă: df. astype ({“ col_name ”: 'data_type', “ col_name ”: ' data_type ', “ col_name ”: ' data_type '}).dtypes

Tot ce am făcut aici a fost să separăm toate coloanele pe care dorim să le convertim cu o virgulă. Col_name ” și „ data_type ” din sintaxă necesită aceleași valori ca cele necesare în timpul conversiei unei singure coloane.

Rezumând-o

Acesta este modul Pandas DataFrame . se folosește metoda astype (). Python este în prezent unul dintre cele mai preferate limbaje de programare, deoarece a pus, de asemenea, un pas în Machine Learning și Data Science. Dacă doriți să știți cum este utilizat Python în aceste două domenii și cum vă poate ajuta cariera în Data Science , puteți citi totul despre el pe blogul nostru. Puteți vizita site-ul web Upgrad pentru a obține un program Executive PG în știința datelor sau certificare PG în Machine Learning și Deep

Cât de greu este să înveți panda?

Pandas este un pachet Python, prin urmare, va trebui să vă familiarizați cu elementele de bază ale sintaxei Python înainte de a începe să-l utilizați. Sintaxa de bază a panda ar putea părea ciudată la început, dar cu practică, puteți învăța lucruri precum gruparea, aplicarea de funcții pe orice axă, pivotarea. Natura polivalentă a lui Python a fost extinsă prin crearea bibliotecii Pandas pentru a aborda și problemele de învățare automată.

Cum pot instala cea mai recentă versiune de Pandas pe PC?

Descărcați și instalați cea mai recentă versiune de pip

2. Descărcați cea mai recentă versiune de Python. Pentru a evita orice dificultăți cu instalarea dvs. Python, faceți clic pe opțiunea pentru a dezactiva lungimea căii după ce ați terminat de instalat Python.

3. Acum că Python este instalat, ar trebui să mergeți la promptul de comandă și să instalați Pandas de acolo. Deci, accesați caseta de căutare de pe desktop și tastați „cmd” în ea. Ar trebui să apară un program numit Command Prompt. Pentru a începe, faceți clic pe butonul.

4. Acum, dați comanda „pip install manager” la promptul de comandă. Așteptați ca descărcarea să se termine, apoi veți putea rula Pandas din aplicația dvs. Python.

Care sunt limitările utilizării Pandas în Python?

Unele dintre sintaxa lui Pandas pot fi complicate atunci când se utilizează nivelurile sale avansate. Aceasta este o problemă, deoarece mulți utilizatori nu pot trece între codul standard Python și Pandas într-un mod eficient și fără probleme.

2. Pe măsură ce progresați și aflați mai multe despre cadrul Pandas, este posibil să găsiți unele concepte puțin greu de înțeles.

3. Pandas va fi de puțin folos odată ce datele dumneavoastră au fost actualizate la o matrice tridimensională (3D) și va trebui să vă bazați pe alte biblioteci, cum ar fi NumPy, pentru asistență, deoarece Pandas are o compatibilitate slabă cu matricea 3D.