Pandas Dataframe Astype: синтаксис, типы данных, создание фрейма данных
Опубликовано: 2020-08-28Python — один из наиболее часто используемых языков в различных отраслях для обработки и анализа данных. Основной причиной популярности Python является его обширный набор библиотек, который упрощает для разработчиков поддержку и мониторинг данных. Одной из таких библиотек, написанных для Python, является Pandas . Библиотека Pandas , в частности, используется для управления временными рядами и таблицами. Ознакомьтесь с нашими курсами по науке о данных, чтобы узнать больше о пандах.
Датафрейм Pandas . Метод astype () или иногда также называемый astype () используется для приведения объектов pandas к типу dtype. функция astype (). Это особенно полезно, когда нам нужно преобразовать тип данных одного или нескольких столбцов таблицы в другой.
Оглавление
Синтаксис Pandas DataFrame.astype()
Во-первых, прежде чем обсуждать синтаксис, нам нужно импортировать библиотеку Pandas, что делается с помощью:
импортировать панд как pd
Синтаксис для DataFrame. метод astype ():
DataFrame.astype(dtype, copy=True, errors='raise', **kwargs)
Параметры
Описание
Значение по умолчанию
тип
Использует numpy.dtype или тип Python для приведения всего объекта к одному типу. В качестве альтернативы он также может использовать {col: dtype, ?}, где col — это метка столбца, и dtype будет работать так же, чтобы привести один или несколько столбцов DataFrame к типам, специфичным для столбцов.
тип
копировать
Возвращает копию при установке значения True (установка copy=false может распространять изменения значений на другие объекты pandas ).
Истинный
ошибки
Управляет исключениями, вызываемыми недопустимыми данными для данного dtype.
поднимать
варги
Аргументы ключевого слова для передачи конструктору.
Возвращает : casted: возвращает аналогичный типу вызывающего объекта.
Читайте: Фреймы данных в Python
Типы данных в библиотеке Pandas
Теперь, когда Pandas DataFrame. Метод astype () посвящен приведению и изменению типов данных в таблицах, давайте посмотрим на типы данных и их использование в библиотеке Pandas .
1. Объект : используется для текста или буквенно-цифровых значений.
2. Int64 : используется для целых чисел.
3. Поплавок64 : Используется для чисел с плавающей запятой.
4. Bool : используется для значений True/False.
5. Datetime64 : используется для значений даты и времени.
6. Timedelta[ns] : используется для различий между двумя датами и временем.
7. Категория : Используется для списка текстовых значений.
Создание DataFrame в библиотеке Pandas
Есть два способа создать фрейм данных в объекте pandas . Мы можем либо создать таблицу, либо вставить существующий файл CSV. Код для вставки существующего файла:
df = pd.read_csv (« имя_файла.csv »)
Синтаксис для создания новой таблицы для фрейма данных:
t = {'столбец 1': [1, 2], 'столбец 2': [3, 4]}
df = pd.DataFrame(данные=t)
Обязательно прочтите: учебник по Python Panda для начинающих
Использование метода Pandas Dataframe.astype()
После того, как мы вставили таблицу и фрейм данных в объект pandas , мы можем начать преобразование типов данных одного или нескольких столбцов таблицы. Мы можем проверить типы данных значений перед их преобразованием, используя код df.dtypes или df.info() . Оба этих кода будут отображать типы данных каждого столбца таблицы.

Еще одна вещь, которую следует отметить, это то, что DataFrame. Метод astype () может выдать ошибку, если фрейм данных имеет значения nan или NA. Поэтому, прежде чем продолжить, нам нужно очистить все значения nan из таблицы. Синтаксис для удаления значений nan или NA:
df.dropna (на месте = Истина)
Преобразование всех столбцов фрейма данных
Синтаксис: дф. astype (' тип_данных ').dtypes
Тип данных всего фрейма данных будет преобразован в значение, которое мы поместили в ' data_type. '
Преобразование определенных столбцов фрейма данных
Синтаксис: дф. astype ({" col_name ": ' data_type '}).dtypes
«col_name» здесь требует имени столбца в качестве входных данных. Какое бы имя столбца мы ни ввели, тип данных этого столбца будет изменен на значение, которое мы указали в ' data_type.'
Преобразование нескольких столбцов за раз
Синтаксис: дф. astype ({" имя_столбца ": 'тип_данных', " имя_столбца ": ' тип_данных ', " имя_столбца ": ' тип_данных '}).dtypes
Все, что мы сделали здесь, это разделили все столбцы, которые мы хотим преобразовать, запятой. « Имя_столбца » и « тип_данных » в синтаксисе требуют тех же значений, что и при преобразовании одного столбца.
Резюмируя это
Вот как Pandas DataFrame . используется метод astype (). Python в настоящее время является одним из наиболее предпочтительных языков программирования, поскольку он также сделал шаг в области машинного обучения и науки о данных. Если вы хотите узнать, как Python используется в этих двух областях и как он может помочь вашей карьере в науке о данных , вы можете прочитать все об этом в нашем блоге. Вы можете посетить веб-сайт Upgrad, чтобы получить программу Executive PG в области науки о данных или сертификацию PG в области машинного обучения и глубокого анализа.
Насколько сложно выучить Pandas?
Pandas — это пакет Python, поэтому вам необходимо ознакомиться с основами синтаксиса Python, прежде чем начать его использовать. Базовый синтаксис pandas может показаться странным на первый взгляд, но с практикой вы сможете изучить такие вещи, как группировка, применение функций к любой оси, поворот. Многоцелевой характер Python был расширен за счет создания библиотеки Pandas для решения проблем машинного обучения.
Как я могу установить последнюю версию Pandas на ПК?
Загрузите и установите последнюю версию pip
2. Загрузите последнюю версию Python. Чтобы избежать каких-либо трудностей с установкой Python, щелкните параметр, чтобы деактивировать длину пути после завершения установки Python.
3. Теперь, когда Python установлен, вы должны перейти в командную строку и установить Pandas оттуда. Итак, перейдите в окно поиска на рабочем столе и введите в него «cmd». Должна появиться программа под названием «Командная строка». Для начала просто нажмите кнопку.
4. Теперь введите команду «pip install manager» в командной строке. Дождитесь завершения загрузки, после чего вы сможете запускать Pandas из своего приложения Python.
Каковы ограничения использования Pandas в Python?
Некоторый синтаксис Pandas может быть сложным при использовании его продвинутых уровней. Это проблема, поскольку многие пользователи не могут эффективно и плавно переключаться между стандартным кодом Python и Pandas.
2. По мере продвижения и изучения фреймворка Pandas некоторые концепции могут показаться вам сложными для понимания.
3. Pandas будет малопригоден после того, как ваши данные будут обновлены до трехмерной (3D) матрицы, и вам придется полагаться на другие библиотеки, такие как NumPy, для помощи, поскольку Pandas имеет плохую совместимость с 3D-матрицей.