Pandas GUI 탐색 [당신이 알아야 할 최고의 기능 목록]
게시 됨: 2020-12-31Pandas는 모든 데이터 과학 애호가가 가장 좋아하는 라이브러리입니다. 구조화된 표 형식, 날짜-시간 형식을 통해 데이터를 처리하는 데 필요한 모든 요구 사항을 충족하고 pandas 연결 작업 내에서 즉시 플로팅을 수행하는 matplotlib API를 제공합니다. 웹사이트의 데이터를 데이터 프레임으로 직접 로드할 수 있습니다. 이 라이브러리는 데이터세트 및 데이터세트와 일치하는 다양한 분포에 대한 통찰력을 나타내는 탐색적 데이터 분석을 수행하는 동안에도 매우 유용합니다.
데이터 탐색을 향상시키기 위해 점점 더 많은 도구가 구축됨에 따라 Pandas GUI는 pandas를 핵심 구성 요소로 사용하고 일반적으로 수동으로 수행되는 많은 추가 기능이 포함된 창 GUI를 표시하는 도구 중 하나입니다.
읽기: 초보자를 위한 10가지 흥미로운 Python GUI 프로젝트 및 주제
이 유틸리티를 살펴보고 몇 가지 최고의 기능을 살펴보겠습니다.
목차
Python GUI의 최고의 기능
1. 기본 설정
Python 패키지이므로 Python 패키지 관리자인 pip를 사용하여 PyPI를 통해 쉽게 설치할 수 있습니다. 이에 대한 설치 명령은 다음과 같습니다.
핍 설치 pandasgui
Pyqt, Plotly와 같은 모든 종속성은 이 명령을 통해 설치됩니다. 설치가 완료되면 pandas를 포함하는 두 개의 모듈과 pandasgui에서 하나의 기능을 가져와야 합니다.
pandas를 pd로 가져오기
pandasgui 수입 쇼에서
show 기능은 GUI 디스플레이의 주요 진입점입니다. 분석을 수행하려는 데이터 세트를 팬더의 데이터 프레임 개체로 사용합니다. 이 패키지는 기능을 테스트하기 위해 사전 로드된 데이터 세트와 함께 제공됩니다. 여기에 포함된 데이터 세트 중 일부는 홍채, 타이타닉, 포켓몬, 자동차 충돌, mpg, 주식 데이터, 팁, mi_manufacturing, gapminder 입니다. 설명을 위해 팁 데이터 세트를 선택하겠습니다. 이 데이터세트를 로드하려면
pandasgui.datasets 가져오기 팁에서
이제 코드의 마지막 단계는 show 함수를 호출하고 GUI 유틸리티를 사용하는 것입니다.
GUI = 표시(팁)
이것을 실행하자마자 응용 프로그램은 표 형식으로 채워진 데이터와 일부 오버헤드 탭을 묻는 메시지를 표시합니다. 아래 이미지를 참조하십시오(이 기사에 제공된 모든 이미지는 작성자가 제공한 것입니다).

2. 다양한 화면 기능
프로그램의 다양한 탭을 살펴보기 전에 주요 화면 기능 중 일부에 대해 알아보겠습니다.
- 데이터 세트의 열 머리글(total_bill, day...)을 클릭하면 해당 열의 오름차순으로 데이터가 정렬되고 다시 클릭하면 내림차순으로 정렬되고 다음 클릭하면 정렬이 재설정됩니다. 이런 식으로 데이터를 쉽게 정렬할 수 있습니다. 여기서는 데이터를 크기 내림차순으로 정렬했습니다.

- 끌어서 놓기만 하면 이 GUI에 여러 CSV를 추가할 수 있습니다. 모든 파일은 왼쪽 패널에 나열되어 매우 쉽게 파일 간에 전환할 수 있습니다.
- 데이터의 셀을 클릭하면 값을 직접 편집할 수 있는 옵션이 표시됩니다. 이것은 엑셀 시트가 제공하는 것과 유사하며 팬더 GUI를 유용하게 만듭니다.
- 왼쪽 클릭을 유지하고 마우스를 가져가서 필요한 모든 셀을 선택하여 데이터의 모든 섹션을 선택할 수 있습니다. 선택한 셀은 파란색으로 강조 표시되며 이 선택은 그대로 복사할 수 있습니다. 이 섹션을 Excel 시트나 메모장에 붙여넣을 수 있습니다!
3. 필터
데이터 프레임 뒤의 첫 번째 탭은 여기에 정의된 조건에 따라 데이터를 필터링할 수 있는 파일러입니다. 기본 pandas의 데이터 프레임 query() 함수를 사용합니다. 이를 통해 사용자가 필요로 하는 데이터 세트의 특정 섹션을 필터링할 수 있습니다. 액세스하려면 필터 탭을 클릭하고 데이터 세트에 해당하는 필터를 생성하면 됩니다. 예를 들어 다음을 적용할 수 있습니다.

성별 == '여자' , 요일 == '금요일' 및 시간 == '점심'

결과 데이터세트는 다음과 같습니다.

4. 통계
고급 분석을 진행하기 전에 기능의 데이터 유형, 개수, 최소-최대 값 등을 살펴보는 것이 좋습니다. pandas describe() 함수가 이 요약을 제공합니다. 이 GUI 프레젠테이션에서 통계 탭은 동일한 작업을 수행합니다. 데이터 유형, 개수, 고유 값 개수, 평균, 표준 편차 및 최소-최대값을 표시합니다.

5. 그래퍼
이름에서 알 수 있듯이 이 탭에서는 데이터 시각화 아래에 있는 다양한 유형의 그래프를 그릴 수 있습니다. 향후 분석에서 유용할 수 있고 모델 교육을 위해 선택할 기능을 결정하는 데 도움이 될 수 있는 사실을 발견할 수 있도록 데이터를 구성하는 것이 중요합니다. Pandas GUI는 히스토그램, 스캐터, 라인, 바, 박스, 바이올린, 히트맵, 파이, 워드 클라우드까지 지원합니다.
이 GUI에서 플롯을 구성하는 것은 간단한 드래그 앤 드롭 열입니다. 시간과 관련하여 제공된 총 청구서 및 팁에 대한 산점도를 표시하려고 한다고 가정합니다. Grapher를 클릭하고 산점도를 선택하고 총 청구서를 열 이름 섹션의 바로 오른쪽에 있는 x로 드래그한 다음 마침을 클릭하여 플롯을 렌더링하기만 하면 됩니다.
이 탭에서 생성된 모든 플롯은 Plotly 라이브러리를 사용하여 작성되었기 때문에 대화형입니다.

반드시 읽어야 함: GitHub 대 GitLab: GitHub와 GitLab의 차이점
6. 리셰이퍼
이 탭은 피벗 테이블과 멜트의 두 가지 기능을 제공합니다. 피벗 테이블은 사용자가 여러 값이 있는 열을 자신의 열로 변환할 수 있게 해주는 중요하고 강력한 통계 기능입니다. 용융 기능은 피벗의 반대입니다. 열을 단일 행으로 변환할 수 있습니다. 이 두 기능은 데이터를 요약할 때 유용합니다.
팬더는 둘 다에 대해 별도의 기능을 제공하며 GUI는 인덱스, 열, 피벗의 경우 값 및 용융의 경우 id_vars 및 value_vars로 전달되는 열의 끌어서 놓기를 제공합니다.
결론
Pandas GUI는 사용자가 핵심 코딩 없이 데이터 세트를 시각적으로 처리할 수 있는 훌륭한 프로젝트입니다. 수정된 데이터 세트는 상단 메뉴 편집 옵션에서 내보낼 수 있습니다. 이 프로젝트에는 정규식 검색, 이 프로젝트의 향후 버전에 통합될 수 있는 null 값 채우기와 같은 훨씬 더 많은 기능이 부족하지만 오픈 소스이기 때문에 여전히 매우 훌륭한 도구입니다. 업계에서 사용할 수 있는 도구를 찾고 있다면 Google DataFlow를 사용해 볼 수 있습니다.
세계 최고의 대학에서 데이터 과학 과정 을 배우십시오 . 이그 제 큐 티브 PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 획득하여 경력을 빠르게 추적하십시오.
팬더 GUI란 무엇입니까?
Pandas GUI는 Pandas 라이브러리를 기반으로 하는 다양한 기능을 사용하여 데이터 프레임을 탐색하고 분석할 수 있는 놀라운 인터페이스입니다. 이 간단한 GUI 기반 도구를 사용하면 코딩 없이 모든 기능을 사용할 수 있습니다.
데이터 과학자들은 이 도구가 데이터를 분석, 조작, 필터링하고 이를 사용하여 플롯을 생성하는 데 매우 유용하다는 것을 알게 되었습니다. 이 모든 것은 작업을 효율적으로 수행하기 위한 많은 기능과 함께 제공되는 데스크탑 GUI 창을 사용하여 한 줄의 코드 없이 수행할 수 있습니다.
Pandas 라이브러리는 어떤 주요 기능을 제공합니까?
Pandas 라이브러리가 제공하는 최고의 기능 중 하나는 데이터를 쉽고 효율적으로 조작할 수 있는 데이터 프레임 및 시리즈입니다. 또한 데이터를 효율적으로 인덱싱하는 지능형 데이터 구성 방법과 함께 제공됩니다.
데이터 조작 기능 외에도 누락된 값을 처리하기 위한 통합 도구도 제공합니다. 잘못된 결과를 피하기 위해 데이터를 분석할 준비가 되도록 데이터를 정리하는 방법도 제공됩니다.
시스템에서 Pandas 라이브러리를 설정하는 방법은 무엇입니까?
Pandas는 Python 패키지이므로 Python 패키지 관리자인 pip를 사용하여 PyPI를 사용하여 쉽게 설치할 수 있습니다. 편집기에서 "pandasgui" 명령을 실행했습니다. Pyqt, Plotly와 같은 모든 종속성은 이 명령을 통해 설치됩니다. 설치가 완료되면 pandas를 포함하는 두 개의 모듈과 pandasgui에서 하나의 기능을 가져와야 합니다. 이러한 모듈은 "pd로 pandas 가져오기" 및 "pandasgui import show에서" 명령을 사용하여 설치할 수 있습니다.
