Pandas Dataframe Astype : syntaxe, types de données, création d'une trame de données

Publié: 2020-08-28

Python est l'un des langages les plus utilisés dans diverses industries à des fins de manipulation et d'analyse de données. La principale raison de la popularité de Python est son vaste ensemble de bibliothèques qui permet aux développeurs de gérer et de surveiller facilement les données. Une de ces bibliothèques écrites pour Python est Pandas . La bibliothèque Pandas , en particulier, est utilisée pour manipuler des séries chronologiques et des tables. Consultez nos cours de science des données pour en savoir plus sur les pandas.

Le cadre de données Pandas . astype () ou parfois aussi appelée méthode astype () est utilisée pour convertir des objets pandas en dtype. fonction astype (). C'est particulièrement très utile lorsque nous avons besoin de convertir le type de données d'une ou plusieurs colonnes d'une table à une autre.

Table des matières

Syntaxe de Pandas DataFrame.astype()

Tout d'abord, avant de discuter de la syntaxe, nous devons importer la bibliothèque Pandas, ce qui se fait par :

importer des pandas en tant que pd

La syntaxe de DataFrame. La méthode astype () est :

DataFrame.astype(dtype, copy=True, errors='raise', **kwargs)

Paramètres

La description

Valeur par défaut

dtype

Utilise numpy.dtype ou le type Python pour convertir l'objet entier dans le même type. Il peut également utiliser {col: dtype, ?} où col est l'étiquette de la colonne, et dtype fonctionnera de la même manière pour convertir une ou plusieurs des colonnes du DataFrame en types spécifiques à la colonne.

dtype

copie

Renvoie une copie lors de la définition sur True (la définition de copy=false peut propager les modifications de valeurs à d'autres objets pandas ).

Vrai

les erreurs

Contrôle les exceptions qui se déclenchent sur des données non valides pour le dtype donné.

élever

kwargs

Arguments de mot-clé à transmettre au constructeur.

Retourne : casté : retour similaire au type de l'appelant.

Lire : Les cadres de données en Python

Types de données dans la bibliothèque Pandas

Maintenant depuis Pandas DataFrame. La méthode astype () concerne la conversion et la modification des types de données dans les tables, examinons les types de données et leur utilisation dans la bibliothèque Pandas .

1. Objet : Utilisé pour du texte ou des valeurs alphanumériques.

2. Int64 : utilisé pour les nombres entiers.

3. Float64 : Utilisé pour les nombres à virgule flottante.

4. Bool : Utilisé pour les valeurs Vrai/Faux.

5. Datetime64 : utilisé pour les valeurs de date et d'heure.

6. Timedelta[ns] : Utilisé pour les différences entre deux datetimes.

7. Catégorie : Utilisé pour une liste de valeurs de texte.

Création d'un DataFrame dans la bibliothèque Pandas

Il existe deux façons de créer une trame de données dans un objet pandas . Nous pouvons soit créer un tableau, soit insérer un fichier CSV existant. Le code pour insérer un fichier existant est :

df = pd.read_csv(“ nom_fichier.csv ”)

La syntaxe pour créer une nouvelle table pour le bloc de données est :

t = {'col 1' : [1, 2], 'col 2' : [3, 4]}

df = pd.DataFrame(data=t)

Doit lire: Tutoriel Python Panda pour les débutants

Utilisation de la méthode Pandas Dataframe.astype()

Une fois que nous avons inséré la table et la trame de données dans l' objet pandas , nous pouvons commencer à convertir les types de données d'une ou plusieurs colonnes de la table. Nous pouvons vérifier les types de données des valeurs avant de les convertir en utilisant le code df.dtypes ou df.info() . Ces deux codes afficheront les types de données de chaque colonne du tableau.

Une autre chose à noter est que le DataFrame. La méthode astype () peut donner une erreur si la trame de données a des valeurs nan ou NA. Donc, avant de continuer, nous devons effacer toutes les valeurs nan du tableau. La syntaxe pour supprimer les valeurs nan ou NA est :

df.dropna(inplace = True)

Conversion de toutes les colonnes d'un dataframe

Syntaxe : df. astype (' data_type ').dtypes

Le type de données entier de la trame de données sera converti en la valeur que nous avons mise dans ' data_type. '

Conversion de colonnes spécifiques d'une trame de données

Syntaxe : df. astype ({“ nom_col ”: ' type_données '}).dtypes

"col_name" nécessite ici un nom de colonne en entrée. Quel que soit le nom de colonne que nous mettons, le type de données de cette colonne sera remplacé par la valeur que nous fournissons dans ' data_type.'

Conversion de plusieurs colonnes à la fois

Syntaxe : df. astype ({" nom_col " : 'type_données', " nom_col " : ' type_données ', " nom_col " : ' type_données '}).dtypes

Tout ce que nous avons fait ici a été de séparer toutes les colonnes que nous voulons convertir par une virgule. Le « col_name » et le « data_type » dans la syntaxe nécessitent les mêmes valeurs que celles requises lors de la conversion d'une seule colonne.

Le résumer

C'est ainsi que le Pandas DataFrame. La méthode astype () est utilisée. Python est actuellement l'un des langages de programmation les plus appréciés car il a également mis un pied dans l'apprentissage automatique et la science des données. Si vous voulez savoir comment Python est utilisé dans ces deux domaines et comment il peut vous aider dans votre carrière en Data Science , vous pouvez tout lire sur notre blog. Vous pouvez visiter le site Web d' Upgrad pour obtenir un programme exécutif PG en science des données ou une certification PG en apprentissage automatique et en profondeur.

À quel point est-il difficile d'apprendre les pandas ?

Pandas est un package Python, vous devez donc vous familiariser avec les bases de la syntaxe Python avant de commencer à l'utiliser. La syntaxe de base des pandas peut sembler étrange au début, mais avec de la pratique, vous pouvez apprendre des choses comme le regroupement, l'application de fonctions à n'importe quel axe, le pivotement. La nature polyvalente de Python a été étendue par la création de la bibliothèque Pandas pour résoudre également les problèmes d'apprentissage automatique.

Comment puis-je installer la dernière version de Pandas sur PC ?

Téléchargez et installez la dernière version de pip

2. Téléchargez la dernière version de Python. Pour éviter toute difficulté avec votre installation Python, cliquez sur l'option pour désactiver la longueur du chemin une fois que vous avez terminé l'installation de Python.

3. Maintenant que Python est installé, vous devez accéder à l'invite de commande et installer Pandas à partir de là. Alors, allez dans le champ de recherche de votre bureau et tapez "cmd" dedans. Un programme appelé Invite de commandes devrait apparaître. Pour commencer, cliquez simplement sur le bouton.

4. Maintenant, donnez la commande 'pip install manager' à l'invite de commande. Attendez la fin du téléchargement, puis vous pourrez exécuter Pandas depuis votre application Python.

Quelles sont les limites de l'utilisation de Pandas en Python ?

Certaines syntaxes de Pandas peuvent être compliquées lors de l'utilisation de ses niveaux avancés. C'est un problème car de nombreux utilisateurs sont incapables de se déplacer entre le code Python standard et Pandas de manière efficace et fluide.

2. Au fur et à mesure que vous progressez et que vous en apprenez davantage sur le framework Pandas, vous trouverez peut-être certains concepts un peu difficiles à comprendre.

3. Pandas sera peu utile une fois que vos données auront été mises à niveau vers une matrice tridimensionnelle (3D), et vous devrez vous fier à d'autres bibliothèques telles que NumPy pour obtenir de l'aide, car Pandas a une mauvaise compatibilité avec la matrice 3D.