Pandas Dataframe Astype: Syntax, Datentypen, Dataframe erstellen

Veröffentlicht: 2020-08-28

Python ist eine der am häufigsten verwendeten Sprachen in verschiedenen Branchen für Datenmanipulations- und Analysezwecke. Der Hauptgrund für die Popularität von Python ist seine große Auswahl an Bibliotheken, die es Entwicklern leicht machen, Daten zu pflegen und zu überwachen. Eine solche für Python geschriebene Bibliothek ist Pandas . Insbesondere die Pandas -Bibliothek wird zur Manipulation von Zeitreihen und Tabellen verwendet. Sehen Sie sich unsere Data-Science-Kurse an, um mehr über Pandas zu erfahren.

Der Pandas DataFrame. astype () oder manchmal auch als astype () bezeichnete Methode wird verwendet, um Pandas - Objekte in einen dtype umzuwandeln. astype ()-Funktion. Es ist besonders nützlich, wenn wir den Datentyp einer oder mehrerer Spalten einer Tabelle in einen anderen konvertieren müssen.

Inhaltsverzeichnis

Syntax von Pandas DataFrame.astype()

Bevor wir die Syntax besprechen, müssen wir zunächst die Pandas-Bibliothek importieren, was folgendermaßen geschieht:

pandas als pd importieren

Die Syntax für DataFrame. astype () Methode ist:

DataFrame.astype(dtype, copy=True, errors='raise', **kwargs)

Parameter

Beschreibung

Standardwert

dtyp

Verwendet numpy.dtype oder den Python-Typ, um das gesamte Objekt in denselben Typ umzuwandeln. Alternativ kann auch {col: dtype, ?} verwendet werden, wobei col die Spaltenbezeichnung ist und dtype genauso funktioniert, um eine oder mehrere Spalten des DataFrame in spaltenspezifische Typen umzuwandeln.

dtyp

Kopieren

Gibt eine Kopie zurück, wenn es auf True gesetzt wird (das Setzen von copy=false kann Änderungen an Werten an andere Pandas- Objekte weitergeben).

Wahr

Fehler

Steuert Ausnahmen, die bei ungültigen Daten für den angegebenen dtype ausgelöst werden.

heben

kwargs

An den Konstruktor zu übergebende Schlüsselwortargumente.

Rückgaben : gecastet: Rückgabe ähnlich dem Typ des Anrufers.

Lesen Sie: Datenrahmen in Python

Datentypen in der Pandas-Bibliothek

Jetzt seit Pandas DataFrame. Bei der Methode astype () geht es um das Umwandeln und Ändern von Datentypen in Tabellen. Schauen wir uns die Datentypen und ihre Verwendung in der Pandas - Bibliothek an.

1. Objekt : Wird für Text oder alphanumerische Werte verwendet.

2. Int64 : Wird für Ganzzahlen verwendet.

3. Float64 : Wird für Fließkommazahlen verwendet.

4. Bool : Wird für True/False-Werte verwendet.

5. Datetime64 : Wird für Datums- und Uhrzeitwerte verwendet.

6. Timedelta[ns] : Wird für Differenzen zwischen zwei Datumszeiten verwendet.

7. Kategorie : Wird für eine Liste von Textwerten verwendet.

Erstellen eines DataFrame in der Pandas-Bibliothek

Es gibt zwei Möglichkeiten, einen Datenrahmen in einem Pandas - Objekt zu erstellen. Wir können entweder eine Tabelle erstellen oder eine vorhandene CSV-Datei einfügen. Der Code zum Einfügen einer vorhandenen Datei lautet:

df = pd.read_csv(“ Dateiname.csv ”)

Die Syntax zum Erstellen einer neuen Tabelle für den Datenrahmen lautet:

t = {'Spalte 1': [1, 2], 'Spalte 2': [3, 4]}

df = pd.DataFrame(data=t)

Muss gelesen werden: Python Panda Tutorial für Anfänger

Verwenden der Dataframe.astype()-Methode von Pandas

Sobald wir die Tabelle und den Datenrahmen in das Pandas -Objekt eingefügt haben, können wir mit der Konvertierung der Datentypen einer oder mehrerer Spalten der Tabelle beginnen. Wir können die Datentypen von Werten überprüfen, bevor wir sie konvertieren, indem wir den Code df.dtypes oder df.info() verwenden . Diese beiden Codes zeigen die Datentypen jeder Spalte der Tabelle an.

Eine weitere zu beachtende Sache ist, dass der DataFrame. Die Methode astype () kann einen Fehler ausgeben, wenn der Datenrahmen nan- oder NA-Werte hat. Bevor wir fortfahren, müssen wir also alle nan-Werte aus der Tabelle löschen. Die Syntax zum Löschen von nan- oder NA-Werten lautet:

df.dropna(inplace = True)

Konvertieren aller Spalten eines Datenrahmens

Syntax: df. astype (' data_type '). dtypes

Der Datentyp des gesamten Datenrahmens wird in den Wert konvertiert, den wir in ' data_type. '

Konvertieren bestimmter Spalten eines Datenrahmens

Syntax: df. astype ({“ col_name ”: ' data_type '}).dtypes

„col_name“ erfordert hier einen Spaltennamen als Eingabe. Welchen Spaltennamen wir auch immer eingeben, der Datentyp dieser Spalte wird in den Wert geändert, den wir in „ data_type“ angeben.

Konvertieren mehrerer Spalten gleichzeitig

Syntax: df. astype ({„ Spaltenname “: „Datentyp“, „ Spaltenname “: „ Datentyp “, „ Spaltenname “: „ Datentyp “}).dtypes

Hier haben wir lediglich alle Spalten, die wir umwandeln wollen, mit einem Komma getrennt. Spaltenname “ und „ Datentyp “ in der Syntax erfordern die gleichen Werte wie beim Konvertieren einer einzelnen Spalte.

Zusammenfassend

So funktioniert der Pandas DataFrame. astype () Methode wird verwendet. Python ist derzeit eine der am meisten bevorzugten Programmiersprachen, da es auch einen Fuß in Machine Learning und Data Science gesetzt hat. Wenn Sie wissen möchten, wie Python in diesen beiden Bereichen verwendet wird und wie es Ihrer Karriere in Data Science helfen kann, können Sie alles darüber in unserem Blog lesen. Sie können die Website von Upgrad besuchen , um ein Executive PG-Programm in Data Science oder eine PG-Zertifizierung in Machine Learning und Deep zu erhalten

Wie schwierig ist es, Pandas zu lernen?

Pandas ist ein Python-Paket, daher müssen Sie mit den Grundlagen der Python-Syntax vertraut sein, bevor Sie damit beginnen. Die grundlegende Pandas-Syntax mag zunächst seltsam erscheinen, aber mit etwas Übung können Sie Dinge wie Gruppieren, Anwenden von Funktionen auf beliebige Achsen und Schwenken lernen. Die Vielseitigkeit von Python wurde durch die Erstellung der Pandas-Bibliothek erweitert, um auch Probleme des maschinellen Lernens anzugehen.

Wie kann ich die neueste Version von Pandas auf dem PC installieren?

Laden Sie die neueste Version von Pip herunter und installieren Sie sie

2. Laden Sie die neueste Version von Python herunter. Um Probleme mit Ihrer Python-Installation zu vermeiden, klicken Sie nach Abschluss der Python-Installation auf die Option zum Deaktivieren der Pfadlänge.

3. Nachdem Python installiert ist, sollten Sie zur Eingabeaufforderung gehen und Pandas von dort aus installieren. Gehen Sie also zum Suchfeld Ihres Desktops und geben Sie „cmd“ ein. Ein Programm namens Command Prompt sollte erscheinen. Um zu beginnen, klicken Sie einfach auf die Schaltfläche.

4. Geben Sie nun an der Eingabeaufforderung den Befehl „pip install manager“ ein. Warten Sie, bis der Download abgeschlossen ist, und Sie können Pandas in Ihrer Python-Anwendung ausführen.

Was sind die Einschränkungen bei der Verwendung von Pandas in Python?

Einige der Syntax von Pandas können kompliziert sein, wenn die fortgeschrittenen Ebenen verwendet werden. Dies ist ein Problem, da viele Benutzer nicht in der Lage sind, effizient und reibungslos zwischen Standard-Python-Code und Pandas zu wechseln.

2. Wenn Sie Fortschritte machen und mehr über das Pandas-Framework erfahren, werden Sie einige Konzepte möglicherweise etwas schwer verständlich finden.

3. Pandas werden wenig nützlich sein, sobald Ihre Daten auf eine dreidimensionale (3D-)Matrix aktualisiert wurden, und Sie müssen sich auf andere Bibliotheken wie NumPy verlassen, um Unterstützung zu erhalten, da Pandas eine schlechte 3D-Matrix-Kompatibilität aufweist.