17 Must Read Pandas Wywiad Pytania i odpowiedzi [Dla nowicjuszy i doświadczonych]

Opublikowany: 2020-07-29

Pandas to licencjonowana przez BSD biblioteka Pythona typu open source, oferująca wydajne, łatwe w użyciu struktury danych i narzędzia do analizy danych. Python z Pandas jest używany w wielu różnych dyscyplinach, w tym w ekonomii, finansach, statystyce, analityce i nie tylko. W tym artykule wymieniliśmy kilka podstawowych pytań do wywiadu z pandami i pytań do wywiadu NumPy, które musi znać uczeń Pythona. Jeśli chcesz dowiedzieć się więcej o Pythonie, zapoznaj się z naszymi programami do nauki danych.

Spis treści

Pytania i odpowiedzi na wywiad z Pandami

Pytanie 1 – Zdefiniuj Pandy Pythona.

Pandy odnoszą się do biblioteki oprogramowania napisanej specjalnie dla Pythona, która służy do analizowania i manipulowania danymi. Pandas to wieloplatformowa biblioteka typu open source stworzona przez Wesa McKinneya. Został wydany w 2008 roku i zawierał struktury danych i operacje do manipulowania danymi liczbowymi i szeregami czasowymi. Pandy można zainstalować za pomocą dystrybucji pip lub Anaconda. Pandy bardzo ułatwiają wykonywanie operacji uczenia maszynowego na danych tabelarycznych.

Pytanie 2 – Jakie są różne typy struktur danych w Pandach?

Biblioteka Panda obsługuje dwa główne typy struktur danych, DataFrames i Series. Obie te struktury danych są zbudowane na szczycie NumPy. Seria to jednowymiarowa i najprostsza struktura danych, podczas gdy DataFrame jest dwuwymiarowa. Inna etykieta osi znana jako „Panel” to trójwymiarowa struktura danych zawierająca elementy, takie jak główna_oś i mniejsza_oś.

Źródło

Pytanie 3 – Wyjaśnij serię w pandach.

Seria to jednowymiarowa tablica, która może przechowywać wartości danych dowolnego typu (string, float, integer, obiekty Pythona itp.). Jest to najprostszy typ struktury danych w Pandach; tutaj etykiety osi danych nazywane są indeksem.

Pytanie 4 – Zdefiniuj Dataframe w Pandach.

DataFrame to dwuwymiarowa tablica, w której dane są wyrównane w formie tabelarycznej z wierszami i kolumnami. Dzięki tej strukturze możesz wykonywać operacje arytmetyczne na wierszach i kolumnach.

Pytanie 5 – Jak stworzyć pustą ramkę danych w Pandas?

Aby utworzyć pustą ramkę DataFrame w Pandas, wpisz

importuj pandy jako PD

ab = pd.DataFrame()

Pytanie 6: Jakie są najważniejsze cechy Biblioteki Pand?

Ważnymi cechami biblioteki pandy są:

Wyrównanie danych
Scal i dołącz
Wydajna pamięć
Szereg czasowy
Przekształcanie

Przeczytaj: Dataframe w Apache PySpark: kompleksowy samouczek

Pytanie 7: Jak wyjaśnisz ponowną indeksację u Pand?

Ponowna indeksacja oznacza modyfikację danych w celu dopasowania określonego zestawu etykiet wzdłuż określonej osi.

Za pomocą indeksowania można wykonać różne operacje, takie jak:

Wstaw znaczniki brakujących wartości (NA) w miejscach etykiet, w których nie ma danych dla etykiety.
Zmień kolejność istniejącego zestawu danych, aby pasował do nowego zestawu etykiet.

Pytanie 8: Jakie są różne sposoby tworzenia DataFrame w pandach? Wyjaśnij na przykładach.

DataFrame można utworzyć za pomocą list lub dykt z tablic nd.

Przykład 1 – Tworzenie DataFrame przy użyciu List

importuj pandy jako PD

# lista ciągów

Strlist = ['Pandy', 'NumPy']

# Wywołanie konstruktora DataFrame na liście

lista = pd.DataFrame(Strlist)

drukuj(lista)

Przykład 2 – Tworzenie DataFrame przy użyciu dyktatu tablic

importuj pandy jako PD

lista = {'ID': [1001, 1002, 1003],'Dział':['Nauka', 'Handel', 'Sztuka',]}

lista = pd.DataFrame(lista)

drukuj (lista)

Sprawdź: Pytania do wywiadu na temat nauki o danych

Pytanie 9 – Wyjaśnij dane kategoryczne w Pandach ?

Dane kategoryczne odnoszą się do danych w czasie rzeczywistym, które mogą się powtarzać; na przykład wartości danych w kategoriach takich jak kraj, płeć, kody zawsze będą się powtarzać. Wartości kategoryczne w pandach mogą również przyjmować tylko ograniczoną i ustaloną liczbę możliwych wartości.

Na takich danych nie można wykonywać operacji numerycznych. Wszystkie wartości danych kategorycznych w pandach są albo w kategoriach, albo np.nan.

Ten typ danych może być przydatny w następujących przypadkach:

Jeśli zmienna łańcuchowa zawiera tylko kilka różnych wartości, przekonwertowanie jej na zmienną kategoryczną może zaoszczędzić trochę pamięci.

Jest to przydatne jako sygnał dla innych bibliotek Pythona, ponieważ ta kolumna musi być traktowana jako zmienna kategorialna.

Porządek leksykalny można przekonwertować na porządek kategorialny w celu prawidłowego posortowania, podobnie jak porządek logiczny.

Pytanie 10: Stwórz serię za pomocą Dict In Pandas.

importuj pandy jako PD

importuj numer jako np

ser = {'a' : 1, 'b' : 2, 'c' : 3}

ans = pd.Seria(ser)

drukuj (od)

Pytanie 11: Jak stworzyć kopię serii w Pandach?

Aby utworzyć kopię serii w pandach, używana jest następująca składnia:

pandy.seria.kopia

Seria.copy(głębokie=prawda)

* jeśli wartość deep jest ustawiona na false, dane ani indeksy nie zostaną skopiowane.

Pytanie 12: Jak dodasz indeks, wiersz lub kolumnę do ramki danych w Pandas?

Aby dodać wiersze do DataFrame, możemy użyć .loc(), .iloc() i .ix(). .loc() jest oparte na etykiecie, .iloc() jest oparte na liczbach całkowitych, a .ix() jest oparte na etykiecie stoiska i liczbach całkowitych. Aby dodać kolumny do DataFrame, możemy ponownie użyć .loc() lub .iloc().

Pytanie 13: Jakiej metody użyjesz, aby zmienić nazwę indeksu lub kolumn Pandy Dataframe?

Metoda .rename może służyć do zmiany nazw kolumn lub wartości indeksu DataFrame

Pytanie 14: Jak możesz iterować po Dataframe w Pandas?

Do iteracji DataFrame w pandach można użyć pętli for w połączeniu z wywołaniem iterrows().

Pytanie 15: Co to jest tablica Pand Numpy?

Numerical Python (NumPy) jest zdefiniowany jako wbudowany pakiet w Pythonie do wykonywania obliczeń numerycznych i przetwarzania wielowymiarowych i jednowymiarowych elementów tablicy.

Tablica NumPy oblicza szybciej w porównaniu z innymi tablicami Pythona.

Pytanie 16: Jak można przekonwertować ramkę danych na plik Excel?

Aby przekonwertować pojedynczy obiekt do pliku Excela, możemy po prostu określić nazwę pliku docelowego. Aby jednak przekonwertować wiele arkuszy, musimy utworzyć obiekt ExcelWriter wraz z docelową nazwą pliku i określić arkusz, który chcemy wyeksportować.

Pytanie 17: Co to jest funkcja Groupby w Pandach?

W Pandas funkcja groupby() pozwala programistom na przearanżowanie danych, używając ich na rzeczywistych zestawach. Podstawowym zadaniem funkcji jest podzielenie danych na różne grupy.

Przeczytaj także: 15 najlepszych projektów Python AI i uczenia maszynowego Open Source

Wniosek

Mamy nadzieję, że powyższe pytania do rozmowy kwalifikacyjnej P andas oraz pytania do rozmowy kwalifikacyjnej NumPy pomogą Ci przygotować się do nadchodzących sesji kwalifikacyjnych. Jeśli szukasz kursów, które pomogą Ci opanować język Python , upGrad może być najlepszą platformą.

Jeśli jesteś zainteresowany nauką o danych, sprawdź program IIIT-B i upGrad Executive PG w dziedzinie Data Science, który jest stworzony dla pracujących profesjonalistów i oferuje ponad 10 studiów przypadków i projektów, praktyczne warsztaty praktyczne, mentoring z ekspertami z branży, 1 -on-1 z mentorami branżowymi, ponad 400 godzin nauki i pomocy w pracy z najlepszymi firmami.

W jakim celu wykorzystywana jest biblioteka Pandas?

Głównym powodem korzystania z Pand jest analiza danych. Pandas umożliwia użytkownikom importowanie danych z różnych formatów, takich jak Microsoft Excel, SQL, JSON, a także wartości rozdzielanych przecinkami. Pandy są uważane za bardzo przydatne do analizy danych, ponieważ umożliwiają użytkownikom wykonywanie różnych operacji manipulacji danymi, takich jak wybieranie, przekształcanie, scalanie i czyszczenie danych. Poza tym Pandy zapewniają również różne funkcje przetwarzania danych.

W uproszczeniu można powiedzieć, że Pandy ułatwiają wykonywanie różnych czasochłonnych i powtarzalnych zadań z wykorzystaniem danych. Zadania, które ułatwiają Pandy to:

1. Scalanie i łączenie Statystyczne
2.analiza danych
3. normalizacja danych
4. wypełnianie danych
5. oczyszczanie danych
6. inspekcja Ładowanie i zapisywanie danych
7. Wizualizacja danych

To tylko kilka zadań związanych z manipulacją danymi, które są łatwe dzięki Pandas. Data Scientists głosują, że Pandy są najlepszym dostępnym narzędziem do analizy i manipulacji danymi.

Jakie są niektóre z podstawowych funkcji udostępnianych przez Python Pandy?

Aby wykorzystać prawdziwą moc biblioteki Pandas w Pythonie, powinieneś zapoznać się z niektórymi podstawowymi funkcjami oferowanymi użytkownikom. Jeśli chodzi o analizę danych, Pandas jest uważana za najpotężniejsze narzędzie z wieloma funkcjami ułatwiającymi pracę użytkownikom.

Niektóre z podstawowych funkcji, o których powinieneś wiedzieć przed rozpoczęciem korzystania z biblioteki Pandy, to:

1. Obsługa danych
2. Wyrównywanie i indeksowanie danych
3. Czyszczenie danych
4. Obsługa brakujących danych
5. Różne narzędzia wejściowe i wyjściowe do odczytu i zapisu danych
6. Obsługuje wiele formatów plików
7. Łącz i łącz różne zbiory danych
8. Optymalizacja wydajności
9. Wizualizacja danych
10. Grupowanie danych zgodnie z wymaganiami
11. Wykonywanie różnych operacji matematycznych na dostępnych danych
12. Maskowanie nieistotnych danych, aby korzystać tylko z wymaganych danych
13. Pobieranie unikalnych danych z różnych powtórzeń w zbiorze danych

Jaki jest powód importowania biblioteki Pandas w Pythonie?

Pandas to biblioteka Pythona typu open source, która jest najczęściej używana do wykonywania różnych zadań związanych z analizą danych, nauką o danych i uczeniem maszynowym. Pandas to najpopularniejszy pakiet do wymiany danych i całkiem dobrze współpracuje z różnymi innymi modułami nauki o danych w ekosystemie Pythona. Biblioteka Pandas jest pierwszą preferencją dla wszystkiego, jeśli chodzi o dane, dla każdego specjalisty zajmującego się nauką danych i analizą danych.