Pandas Dataframe Astype: składnia, typy danych, tworzenie ramki danych

Opublikowany: 2020-08-28

Python jest jednym z najczęściej używanych języków w różnych branżach do manipulacji i analizy danych. Największym powodem popularności Pythona jest ogromny zestaw bibliotek, które ułatwiają programistom utrzymywanie i monitorowanie danych. Jedną z takich bibliotek napisanych dla Pythona jest Pandas . W szczególności biblioteka Pandas służy do manipulowania szeregami czasowymi i tabelami. Sprawdź nasze kursy nauki o danych, aby dowiedzieć się więcej o pandach.

DataFrame Pandy . Metoda astype () lub czasami również określana jako astype () służy do rzutowania obiektów pandas na dtype. funkcja astype (). Jest to szczególnie przydatne, gdy musimy przekonwertować typ danych jednej lub wielu kolumn tabeli na inny.

Spis treści

Składnia Pandy DataFrame.astype()

Po pierwsze, przed omówieniem składni, musimy zaimportować bibliotekę Pandas, co robi:

importuj pandy jako PD

Składnia DataFrame. metoda astype () to:

DataFrame.astype(dtype, copy=True, error='raise', **kwargs)

Parametry

Opis

Domyślna wartość

dtype

Używa numpy.dtype lub typu Python do rzutowania całego obiektu na ten sam typ. Alternatywnie może również użyć {col: dtype, ?}, gdzie col jest etykietą kolumny, a dtype będzie działać tak samo, aby rzutować jedną lub więcej kolumn DataFrame na typy specyficzne dla kolumny.

dtype

Kopiuj

Zwraca kopię w przypadku ustawienia True (ustawienie copy=false może propagować zmiany wartości do innych obiektów pandy ).

Prawdziwe

błędy

Kontroluje wyjątki dotyczące nieprawidłowych danych dla danego typu dtype.

podnieść

kwargs

Argumenty słów kluczowych do przekazania do konstruktora.

Returns : casted: zwrot podobny do typu wywołującego.

Przeczytaj: Ramki danych w Pythonie

Typy danych w bibliotece Pandy

Teraz od Pandas DataFrame. Metoda astype () polega na rzutowaniu i zmianie typów danych w tabelach, przyjrzyjmy się typom danych i ich wykorzystaniu w bibliotece Pandas .

1. Obiekt : Używany do wartości tekstowych lub alfanumerycznych.

2. Int64 : Używany do liczb całkowitych.

3. Float64 : Używany do liczb zmiennoprzecinkowych.

4. Bool : Używany dla wartości True/False.

5. Datetime64 : Używany do wartości daty i godziny.

6. Timedelta[ns] : Używany do różnic między dwiema datami i godzinami.

7. Kategoria : Używana do listy wartości tekstowych.

Tworzenie DataFrame w bibliotece Pandas

Istnieją dwa sposoby tworzenia ramki danych w obiekcie pandas . Możemy stworzyć tabelę lub wstawić istniejący plik CSV. Kod do wstawienia istniejącego pliku to:

df = pd.read_csv(„ nazwa_pliku.csv ”)

Składnia tworzenia nowej tabeli dla ramki danych to:

t = {'kolumna 1': [1, 2], 'kolumna 2': [3, 4]}

df = pd.DataFrame(dane=t)

Musisz przeczytać: samouczek Python Panda dla początkujących

Korzystanie z metody Pandas Dataframe.astype()

Po wstawieniu tabeli i ramki danych do obiektu pandas możemy rozpocząć konwersję typów danych jednej lub więcej kolumn tabeli. Możemy sprawdzić typy danych wartości przed ich konwersją, używając kodu df.dtypes lub df.info() . Oba te kody wyświetlają typy danych każdej kolumny tabeli.

Inną rzeczą, na którą należy zwrócić uwagę, jest to, że DataFrame. Metoda astype () może dać błąd, jeśli ramka danych zawiera wartości nan lub NA. Dlatego przed kontynuowaniem musimy usunąć wszystkie wartości nan z tabeli. Składnia usuwania wartości nan lub NA to:

df.dropna(inplace = Prawda)

Konwersja wszystkich kolumn ramki danych

Składnia: df. astype (' data_type ').dtypes

Typ danych całej ramki danych zostanie przekonwertowany na wartość, którą umieściliśmy w ' data_type. '

Konwertowanie określonych kolumn ramki danych

Składnia: df. astype ({„ nazwa_kolumny ”: ' typ_danych '}).dtypes

„nazwa_kolumny” w tym przypadku wymaga podania nazwy kolumny jako danych wejściowych. Bez względu na to, jaką nazwę wprowadzimy w kolumnie, typ danych tej kolumny zostanie zmieniony na wartość podaną w „ data_type”.

Konwersja wielu kolumn na raz

Składnia: df. astype ({„ nazwa_kolumny ”: 'typ_danych', „ nazwa_kolumny ”: ' typ_danych ', „ nazwa_kolumny ”: ' typ_danych '}).dtypes

Wszystko, co tutaj zrobiliśmy, to oddzielenie przecinkami wszystkich kolumn, które chcemy przekonwertować. „ nazwa_kolumny ” i „ typ_danych ” w składni wymagają tych samych wartości, które są wymagane podczas konwertowania pojedynczej kolumny.

Podsumowując to

W ten sposób Pandas DataFrame . stosowana jest metoda astype (). Python jest obecnie jednym z najbardziej preferowanych języków programowania, ponieważ wprowadził również stopę w uczenie maszynowe i naukę o danych. Jeśli chcesz wiedzieć, jak Python jest używany w tych dwóch dziedzinach i jak może pomóc Twojej karierze w Data Science , możesz przeczytać o tym wszystkim na naszym blogu. Możesz odwiedzić witrynę Upgrad, aby uzyskać Executive PG Program w Data Science lub PG certyfikat w Machine Learning i Deep

Jak trudno jest nauczyć się Pand?

Pandas to pakiet Pythona, dlatego zanim zaczniesz go używać, musisz zapoznać się z podstawami składni Pythona. Podstawowa składnia pand może początkowo wydawać się dziwna, ale z praktyką możesz nauczyć się takich rzeczy, jak grupowanie, stosowanie funkcji do dowolnej osi, obracanie. Wielozadaniowy charakter Pythona został rozszerzony przez utworzenie biblioteki Pandas, która ma również na celu rozwiązywanie problemów z uczeniem maszynowym.

Jak mogę zainstalować najnowszą wersję Pandy na PC?

Pobierz i zainstaluj najnowszą wersję pip

2. Pobierz najnowszą wersję Pythona. Aby uniknąć jakichkolwiek trudności z instalacją Pythona, kliknij opcję dezaktywacji długości ścieżki po zakończeniu instalacji Pythona.

3. Teraz, gdy Python jest zainstalowany, powinieneś przejść do wiersza poleceń i stamtąd zainstalować Pandy. Przejdź więc do pola wyszukiwania na pulpicie i wpisz w nim „cmd”. Powinien pojawić się program o nazwie Wiersz polecenia. Aby rozpocząć, po prostu kliknij przycisk.

4. Teraz wydaj polecenie „pip install manager” w wierszu poleceń. Poczekaj na zakończenie pobierania, a wtedy będziesz mógł uruchamiać Pandy z poziomu swojej aplikacji Pythona.

Jakie są ograniczenia używania Pand w Pythonie?

Niektóre ze składni Pand mogą być skomplikowane podczas korzystania z jej zaawansowanych poziomów. Jest to problem, ponieważ wielu użytkowników nie jest w stanie poruszać się między standardowym kodem Pythona a Pandami w wydajny i płynny sposób.

2. W miarę postępów i zdobywania wiedzy o frameworku Pandas, niektóre koncepcje mogą być trudne do zrozumienia.

3. Pandy będą mało przydatne, gdy Twoje dane zostaną zaktualizowane do trójwymiarowej (3D) macierzy i będziesz musiał polegać na innych bibliotekach, takich jak NumPy, aby uzyskać pomoc, ponieważ Pandy mają słabą kompatybilność z matrycami 3D.