Pandas Dataframe Astype: 구문, 데이터 유형, 데이터 프레임 생성
게시 됨: 2020-08-28Python은 데이터 조작 및 분석 목적으로 다양한 산업 분야에서 가장 많이 사용되는 언어 중 하나입니다. Python이 인기 있는 가장 큰 이유는 개발자가 데이터를 간단하게 유지 관리하고 모니터링할 수 있도록 하는 방대한 라이브러리 집합입니다. Python용으로 작성된 라이브러리 중 하나는 Pandas 입니다. 특히 Pandas 라이브러리는 시계열 및 테이블을 조작하는 데 사용됩니다. 판다에 대해 자세히 알아보려면 데이터 과학 과정을 확인하세요.
판다 스 데이터프레임. astype () 또는 때때로 astype () 메서드 라고도 하는 메서드는 pandas 객체를 dtype 으로 캐스팅하는 데 사용됩니다 . astype () 함수. 테이블의 하나 또는 여러 열의 데이터 형식을 다른 열로 변환해야 할 때 특히 매우 유용합니다.
목차
Pandas DataFrame.astype()의 구문
먼저 구문을 논의하기 전에 Pandas 라이브러리를 가져와야 합니다. 이 작업은 다음과 같이 수행됩니다.
pandas를 pd로 가져오기
DataFrame의 구문입니다. astype () 메서드는 다음과 같습니다.
DataFrame.astype(dtype, copy=True, 오류='raise', **kwargs)
매개변수
설명
기본값
dtype
numpy.dtype 또는 Python 유형을 사용하여 전체 객체를 동일한 유형으로 캐스트합니다. 또는 {col: dtype, ?}를 사용할 수도 있습니다. 여기서 col은 열 레이블이고 dtype은 DataFrame의 열 중 하나 이상을 열별 유형으로 캐스트하기 위해 동일하게 작동합니다.
dtype
복사
True로 설정하면 복사본을 반환합니다(copy=false로 설정하면 값의 변경 사항을 다른 pandas 개체로 전파할 수 있음).
진실
오류
주어진 dtype에 대해 유효하지 않은 데이터에서 발생하는 예외를 제어합니다.
들어 올리다
콰르그
생성자에 전달할 키워드 인수입니다.
반환 값: 캐스트: 호출자의 유형과 유사한 반환.
읽기: Python의 데이터 프레임
Pandas 라이브러리의 데이터 유형
이제 Pandas DataFrame 이후. astype () 메소드는 테이블의 데이터 유형을 캐스팅하고 변경하는 것입니다. Pandas 라이브러리 에서 데이터 유형과 사용법을 살펴보겠습니다 .
1. 개체 : 텍스트 또는 영숫자 값에 사용됩니다.
2. Int64 : 정수로 사용.
3. 플로트64 : 부동 소수점 숫자에 사용됩니다.
4. Bool : True/False 값에 사용됩니다.
5. Datetime64 : 날짜 및 시간 값에 사용됩니다.
6. Timedelta[ns] : 두 날짜 시간의 차이에 사용됩니다.
7. 카테고리 : 텍스트 값 목록에 사용됩니다.
Pandas 라이브러리에서 DataFrame 만들기
pandas 개체 에서 데이터 프레임을 만드는 방법에는 두 가지가 있습니다 . 테이블을 생성하거나 기존 CSV 파일을 삽입할 수 있습니다. 기존 파일을 삽입하는 코드는 다음과 같습니다.
df = pd.read_csv(“파일명.csv ” )
데이터 프레임에 대한 새 테이블을 만드는 구문은 다음과 같습니다.
t = {'열 1': [1, 2], '열 2': [3, 4]}

df = pd.DataFrame(데이터=t)
필독: 초보자를 위한 Python Panda 튜토리얼
Pandas Dataframe.astype() 메서드 사용
pandas 객체 에 테이블과 데이터 프레임이 삽입되면 테이블 의 하나 이상의 열에 대한 데이터 유형 변환을 시작할 수 있습니다. df.dtypes 또는 df.info() 코드를 사용하여 변환하기 전에 값의 데이터 유형을 확인할 수 있습니다 . 이 두 코드 모두 테이블의 각 열에 대한 데이터 유형을 표시합니다.
주목해야 할 또 다른 사항은 DataFrame입니다. astype () 메서드는 데이터 프레임에 nan 또는 NA 값이 있으면 오류가 발생할 수 있습니다. 따라서 계속하기 전에 테이블에서 모든 nan 값을 지워야 합니다. nan 또는 NA 값을 삭제하는 구문은 다음과 같습니다.
df.dropna(inplace = True)
데이터 프레임의 모든 열 변환
구문: df. astype (' data_type ').dtypes
전체 데이터 프레임의 데이터 유형은 우리가 ' data_type 에 넣은 값으로 변환됩니다 . '
데이터 프레임의 특정 열 변환
구문: df. astype ({" col_name ": ' data_type '}).dtypes
여기서 "col_name" 은 입력으로 열 이름이 필요합니다. 어떤 열 이름을 입력하든 해당 열의 데이터 유형은 ' data_type'에 제공된 값으로 변경됩니다.
한 번에 여러 열 변환
구문: df. astype ({" col_name ": 'data_type', " col_name ": ' data_type ', " col_name ": ' data_type '}).dtypes
여기서 우리가 한 일은 변환하려는 모든 열을 쉼표로 구분하는 것뿐이었습니다. 구문 의 " col_name " 및 ' data_type '은 단일 열을 변환하는 동안 필요한 것과 동일한 값이 필요합니다.
요약
이것이 Pandas DataFrame입니다 . astype () 메서드를 사용합니다. Python은 머신 러닝 및 데이터 과학에도 발을 들였기 때문에 현재 가장 선호되는 프로그래밍 언어 중 하나입니다. Python이 이 두 분야에서 어떻게 사용되고 있으며 데이터 과학 경력에 어떻게 도움이 되는지 알고 싶다면 블로그에서 이에 대한 모든 내용을 읽을 수 있습니다. Upgrad의 웹사이트를 방문 하여 데이터 과학의 Executive PG 프로그램 또는 Machine Learning 및 Deep 의 PG 인증 을 받을 수 있습니다.
판다를 배우는 것은 얼마나 어렵습니까?
Pandas는 Python 패키지이므로 사용을 시작하기 전에 Python 구문의 기본 사항에 익숙해져야 합니다. 기본 pandas 구문은 처음에는 이상해 보일 수 있지만 연습을 통해 그룹화, 모든 축에 함수 적용, 피벗과 같은 것을 배울 수 있습니다. Python의 다목적 특성은 Pandas 라이브러리를 생성하여 기계 학습 문제도 해결함으로써 확장되었습니다.
PC에 최신 버전의 Pandas를 설치하려면 어떻게 해야 합니까?
최신 버전의 pip 다운로드 및 설치
2. 최신 버전의 Python을 다운로드합니다. Python 설치에 문제가 발생하지 않도록 하려면 Python 설치를 완료한 후 경로 길이를 비활성화하는 옵션을 클릭하십시오.
3. 이제 Python이 설치되었으므로 명령 프롬프트로 이동하여 거기에서 Pandas를 설치해야 합니다. 따라서 데스크탑의 검색 상자로 이동하여 'cmd'를 입력하십시오. 명령 프롬프트라는 프로그램이 나타나야 합니다. 시작하려면 버튼을 클릭하기만 하면 됩니다.
4. 이제 명령 프롬프트에서 'pip install manager' 명령을 입력합니다. 다운로드가 완료될 때까지 기다리면 Python 애플리케이션 내에서 Pandas를 실행할 수 있습니다.
Python에서 Pandas를 사용할 때의 제한 사항은 무엇입니까?
Pandas의 일부 구문은 고급 수준을 사용할 때 복잡할 수 있습니다. 이것은 많은 사용자가 표준 Python 코드와 Pandas 사이를 효율적이고 원활한 방식으로 이동할 수 없기 때문에 문제입니다.
2. 진행하고 Pandas 프레임워크에 대해 더 많이 배우면서 일부 개념을 이해하기 어려울 수 있습니다.
3. 데이터가 3차원(3D) 매트릭스로 업그레이드되면 Pandas는 거의 사용되지 않으며 Pandas는 3D 매트릭스 호환성이 좋지 않기 때문에 지원을 위해 NumPy와 같은 다른 라이브러리에 의존해야 합니다.
