17 обязательных к прочтению вопросов и ответов из интервью с пандами [для новичков и опытных]

Опубликовано: 2020-07-29

Pandas — это библиотека Python с открытым исходным кодом и лицензией BSD, предлагающая высокопроизводительные, простые в использовании структуры данных и инструменты анализа данных. Python с Pandas используется в широком спектре дисциплин, включая экономику, финансы, статистику, аналитику и многое другое. В этой статье мы перечислили некоторые важные вопросы интервью с пандами и вопросы интервью NumPy , которые должен знать изучающий Python. Если вы хотите узнать больше о python, ознакомьтесь с нашими программами по науке о данных.

Оглавление

Панды Интервью Вопросы и Ответы

Вопрос 1 — Дайте определение Python Pandas.

Панды относятся к программной библиотеке, явно написанной для Python, которая используется для анализа и обработки данных. Pandas — это кроссплатформенная библиотека с открытым исходным кодом, созданная Уэсом МакКинни. Он был выпущен в 2008 году и предоставлял структуры данных и операции для обработки числовых данных и данных временных рядов. Pandas можно установить с помощью дистрибутива pip или Anaconda. Панды упрощают выполнение операций машинного обучения над табличными данными.

Вопрос 2. Какие существуют типы структур данных в Pandas?

Библиотека Panda поддерживает два основных типа структур данных: DataFrames и Series. Обе эти структуры данных построены на основе NumPy. Series — это одномерная и простейшая структура данных, а DataFrame — двумерная. Еще одна метка оси, известная как «Панель», представляет собой трехмерную структуру данных и включает такие элементы, как главная_ось и второстепенная_ось.

Источник

Вопрос 3 — Объясните серию в Pandas.

Серия — это одномерный массив, который может содержать значения данных любого типа (строка, число с плавающей запятой, целое число, объекты Python и т. д.). Это самый простой тип структуры данных в Pandas; здесь метки оси данных называются индексом.

Вопрос 4 — Определить фрейм данных в Pandas.

DataFrame — это двумерный массив, в котором данные выровнены в табличной форме со строками и столбцами. С помощью этой структуры вы можете выполнять арифметические операции со строками и столбцами.

Вопрос 5 — Как создать пустой фрейм данных в Pandas?

Чтобы создать пустой DataFrame в Pandas, введите

импортировать панд как pd

аб = pd.DataFrame()

Вопрос 6. Каковы наиболее важные функции библиотеки Pandas?

Важными особенностями библиотеки панды являются:

Выравнивание данных
Объединяйтесь и присоединяйтесь
Эффективная память
Временные ряды
Изменение формы

Читать: Dataframe в Apache PySpark: подробное руководство

Вопрос 7 — Как вы объясните переиндексацию в Pandas?

Переиндексировать означает изменить данные, чтобы они соответствовали определенному набору меток на определенной оси.

С помощью индексации можно выполнять различные операции, например:

Вставьте маркеры отсутствующих значений (NA) в места метки, где не существовало данных для метки.
Измените порядок существующего набора данных, чтобы он соответствовал новому набору меток.

Вопрос 8. Какие существуют способы создания DataFrame в pandas? Объясните примерами.

DataFrame может быть создан с использованием списков или массивов Dict из nd.

Пример 1 — Создание DataFrame с использованием списка

импортировать панд как pd

# список строк

Strlist = ['Панды', 'NumPy']

# Вызов конструктора DataFrame по списку

список = pd.DataFrame (Список Строк)

распечатать (список)

Пример 2. Создание DataFrame с использованием dict массивов

импортировать панд как pd

list = {'ID': [1001, 1002, 1003], 'Отдел': ['Наука', 'Коммерция', 'Искусство',]}

список = pd.DataFrame (список)

распечатать (список)

Проверьте: вопросы интервью по науке о данных

Вопрос 9 - Объясните категориальные данные в Pandas ?

Категориальные данные относятся к данным в реальном времени, которые могут повторяться; например, значения данных в таких категориях, как страна, пол, коды, всегда будут повторяться. Категориальные значения в pandas также могут принимать только ограниченное и фиксированное количество возможных значений.

С такими данными невозможно выполнить числовые операции. Все значения категорийных данных в пандах находятся либо в категориях, либо в np.nan.

Этот тип данных может быть полезен в следующих случаях:

Если строковая переменная содержит только несколько разных значений, преобразование ее в категориальную переменную может сэкономить память.

Это полезно в качестве сигнала для других библиотек Python, потому что этот столбец должен рассматриваться как категориальная переменная.

Лексический порядок может быть преобразован в категориальный порядок для правильной сортировки, как логический порядок.

Вопрос 10 — Создайте серию с помощью Dict в Pandas.

импортировать панд как pd

импортировать numpy как np

сер = {'а': 1, 'б': 2, 'с': 3}

ответ = pd.Серия(сер)

печатать (ответ)

Вопрос 11 — Как создать копию серии в Pandas?

Для создания копии серии в pandas используется следующий синтаксис:

pandas.series.copy

Series.copy(глубокий=Истина)

* если для параметра deep установлено значение false, он не будет копировать ни данные, ни индексы.

Вопрос 12 — Как вы добавите индекс, строку или столбец в фрейм данных в Pandas?

Чтобы добавить строки в DataFrame, мы можем использовать .loc(), .iloc() и .ix(). .loc() основан на метках, .iloc() основан на целых числах, а .ix() основан на метках стендов и целых числах. Чтобы добавить столбцы в DataFrame, мы снова можем использовать .loc() или .iloc().

Вопрос 13. Какой метод вы будете использовать для переименования индекса или столбцов фрейма данных Pandas?

Метод .rename можно использовать для переименования столбцов или значений индекса DataFrame.

Вопрос 14 — Как вы можете перебирать фрейм данных в Pandas?

Для перебора DataFrame в pandas можно использовать цикл for в сочетании с вызовом iterrows().

Вопрос 15 — Что такое массив Pandas Numpy?

Numerical Python (NumPy) определяется как встроенный в Python пакет для выполнения числовых вычислений и обработки многомерных и одномерных элементов массива.

Массив NumPy вычисляется быстрее по сравнению с другими массивами Python.

Вопрос 16. Как можно преобразовать фрейм данных в файл Excel?

Чтобы преобразовать один объект в файл Excel, мы можем просто указать имя целевого файла. Однако для преобразования нескольких листов нам нужно создать объект ExcelWriter вместе с целевым именем файла и указать лист, который мы хотим экспортировать.

Вопрос 17 — Что такое функция Groupby в Pandas?

В Pandas функция groupby() позволяет программистам переупорядочивать данные, используя их в реальных наборах. Основная задача функции — разбить данные на различные группы.

Читайте также: 15 лучших проектов с открытым исходным кодом для искусственного интеллекта и машинного обучения на Python

Заключение

Мы надеемся, что вышеупомянутые вопросы интервью P andas и вопросы интервью NumPy помогут вам подготовиться к предстоящим собеседованиям. Если вы ищете курсы, которые помогут вам освоить язык Python , upGrad может стать лучшей платформой.

Если вам интересно узнать о науке о данных, ознакомьтесь с программой IIIT-B & upGrad Executive PG по науке о данных, которая создана для работающих профессионалов и предлагает более 10 тематических исследований и проектов, практические семинары, наставничество с отраслевыми экспертами, 1 -на-1 с отраслевыми наставниками, более 400 часов обучения и помощи в трудоустройстве в ведущих фирмах.

Библиотека Pandas используется для какой цели?

Основная причина использования Pandas — анализ данных. Pandas позволяет пользователям импортировать данные из различных форматов, таких как Microsoft Excel, SQL, JSON, а также значения, разделенные запятыми. Pandas считается очень полезным для анализа данных, поскольку он позволяет пользователям выполнять различные операции с данными, такие как выбор, изменение формы, слияние и очистка данных. Помимо этого, Pandas также предоставляет различные функции обработки данных.

Проще говоря, мы можем сказать, что Pandas упрощает выполнение различных трудоемких и повторяющихся задач, связанных с данными. Задачи, облегчаемые с помощью Pandas:

1. Слияние и присоединение к статистике
2.данные анализа
3. данные нормализации
4. заполнение данных
5. очистка данных
6. проверка Загрузка и сохранение данных
7. Визуализация данных

Это лишь некоторые из задач по манипулированию данными, которые легко выполняются с помощью Pandas. Исследователи данных голосуют за Pandas как за лучший инструмент для анализа и обработки данных.

Какие основные функции предоставляет Python Pandas?

Чтобы использовать истинную мощь библиотеки Pandas в Python, вам следует изучить некоторые важные функции, предлагаемые пользователям. Когда дело доходит до анализа данных, Pandas считается самым мощным инструментом с множеством функций, облегчающих работу пользователей.

Некоторые из основных функций, о которых вы должны знать, прежде чем начать использовать библиотеку Pandas:

1. Обработка данных
2. Выравнивание и индексация данных
3. Очистка данных
4. Обработка недостающих данных
5. Различные инструменты ввода и вывода для чтения и записи данных
6. Поддерживает несколько форматов файлов
7. Объединяйте и объединяйте разные наборы данных
8. Оптимизация производительности
9. Визуализация данных
10. Группировка данных по требованию
11. Выполнение различных математических операций над имеющимися данными
12. Маскировка ненужных данных, чтобы использовать только необходимые данные
13. Извлечение уникальных данных из различных повторений в наборе данных

В чем причина импорта библиотеки Pandas в Python?

Pandas — это библиотека Python с открытым исходным кодом, которая наиболее широко используется для выполнения различных задач анализа данных, науки о данных и машинного обучения. Pandas — самый популярный пакет для обработки данных, и он довольно хорошо работает с различными другими модулями обработки данных в экосистеме Python. Библиотека Pandas — это первое предпочтение, когда речь идет о данных для каждого специалиста по науке о данных и анализу данных.