팬더 연결 데이터 프레임 [2022]
게시 됨: 2021-01-06분석을 수행하기 위해 결합해야 하는 두 개의 데이터 세트가 있다고 상상해 보십시오. SQL을 사용하는 동안 데이터베이스에 있는 둘 이상의 테이블에 있는 레코드는 SQL 조인을 사용하여 결합할 수 있습니다. 마찬가지로 Python에는 데이터 프레임을 연결하는 옵션도 있습니다. 그렇다면 데이터 프레임이란 무엇입니까? Python의 데이터 프레임에는 여러 행과 열이 있습니다. SQL의 테이블과 유사합니다. Python에서 데이터 분석을 위한 pandas 소프트웨어 라이브러리가 있습니다. Pandas는 데이터 프레임을 연결하여 특정 논리를 기반으로 데이터 프레임을 결합하는 데 도움이 됩니다.
데이터 프레임을 결합하는 다양한 방법:
- 내부 조인: 내부 조인은 두 집합의 교차점과 매우 유사합니다. 내부 조인의 경우 공통 속성을 가진 행만 포함하는 데이터 프레임이 반환됩니다. 따라서 결합된 두 데이터 프레임의 각 행에는 일치하는 열 값이 있어야 합니다.
- 왼쪽 조인: 왼쪽 조인은 왼쪽 데이터 프레임의 모든 행과 오른쪽 데이터 프레임의 일치하는 행만 반환합니다.
- 오른쪽 조인: 오른쪽 조인은 오른쪽 데이터 프레임의 모든 행을 반환하고 왼쪽 데이터 프레임의 일치하는 행만 반환합니다.
- 전체 또는 외부 조인: 전체 조인은 왼쪽 데이터 프레임과 오른쪽 데이터 프레임의 모든 행을 유지합니다.
원천
이제 Pandas가 데이터 프레임 또는 시리즈를 결합하는 기능을 살펴보겠습니다.
목차
Pandas의 함수
1. 조인 기능
우리가 읽은 것처럼 Python에는 데이터 결합에 사용할 수 있는 SQL과 같은 기능이 많이 있습니다. 데이터 프레임에는 주소 역할을 하는 인덱스가 있습니다. 일반적으로 행 인덱스는 인덱스라고 하며 열은 열 이름으로 주소가 지정됩니다. 조인 작업을 사용하면 두 데이터 프레임의 모든 열을 병합할 수 있습니다. "lsuffix" 및 "rsuffix" 매개변수를 업데이트하여 왼쪽 및 오른쪽 열의 이름을 바꿀 수 있습니다. "how" 매개변수를 업데이트하여 병합 방법을 선택할 수 있는 옵션이 제공됩니다.
2. 병합 기능
병합 기능은 조인 작업과 매우 유사합니다. 그러나 두 데이터 프레임의 모든 열을 결합하는 동안 유연하게 제어할 수 있습니다. on = 열 이름을 사용하여 공통 열의 데이터 프레임을 병합할 수 있습니다. left_on = 열 이름 또는 right_on = 열 이름을 업데이트하여 왼쪽 또는 오른쪽 데이터 프레임의 열을 키로 사용하여 테이블을 정렬할 수 있습니다. left_index = True 또는 right_index = True를 선택하면 왼쪽 데이터 프레임 또는 오른쪽 데이터 프레임의 행 레이블을 조인 키로 사용할 수 있습니다.
통사론:
DataFrame.merge( self , right , how='left' , on=None , left_on=None ,
right_on=None , left_index=False , right_index=False , sort=False , suffixes=('_x' , '_y') , copy=True , indicator=False , validate=None )

읽기: 팬더 인터뷰 질문
3. 연결 기능
Concat 기능을 사용하여 선택에 따라 열 또는 행의 데이터를 결합할 수 있습니다. 두 축 중 하나에 결합 논리(좌/우/내부/완전 결합)를 설정할 수 있습니다. 또한 verify_integrity를 사용하여 연결된 새 축에 중복 값이 있는지 확인하는 옵션이 제공됩니다. 연결 축에 인덱스 값이 지정되지 않은 경우 결과 축은 0,1,… n-1로 레이블이 지정됩니다. keys 매개변수를 사용하면 전달된 키를 사용하여 계층적 인덱싱을 구성할 수 있습니다.
통사론
pandas.concat( objs , axis=0 , join='left' , join_axes=None ,
ignore_index=False , 키=없음 , 수준=없음 , 이름=없음 ,
verify_integrity=False , sort=None , copy=True )
읽기: Python의 데이터 구조 알고리즘
마무리
pandas.DataFrame에서 보았듯이 병합 및 조인 기능은 열에서 작업하는 데이터 프레임을 결합하는 데 사용됩니다. 제공된 접미사를 기반으로 열 이름을 바꾸는 옵션도 있습니다. 병합 기능은 행 단위 정렬의 경우 더 많은 유연성을 제공합니다. 반대로 pandas의 Concat 함수는 행이나 열 모두에서 작동할 수 있습니다.
Concat 함수를 사용하는 동안 열 이름을 바꾸지 않습니다. Pandas는 두 개의 데이터 프레임을 결합해야 할 때 데이터 프레임을 연결하는 데 필수적인 기능입니다. 특정 조건을 사용하여 두 데이터 프레임을 병합하면 분석 및 기타 작업에 필요한 데이터를 준비하는 데 도움이 됩니다. 따라서 소프트웨어 라이브러리의 경우 pandas는 데이터 프레임을 연결하는 필수 기능입니다.
pandas에서 사용할 수 있는 다양한 기능에 대해 자세히 알아보고 데이터 분석에 대해 더 자세히 알고 싶으십니까? upGrad에서 제공하는 Data Science의 PG Diploma를 확인할 수 있습니다 . 이 과정은 업계 전문가가 진행하며 탐색적 데이터 분석, 다양한 데이터 시각화 기술 및 기계 학습 알고리즘에 대해 자세히 배우는 데 도움이 됩니다. upGrad와 함께 데이터 분석 및 기계 학습 분야에서 경력을 시작하십시오.
Pandas의 다양한 관절 유형은 무엇입니까?
Pandas 라이브러리는 데이터 프레임을 결합하기 위해 4가지 다른 조인을 제공합니다. 이러한 조인은 다음과 같습니다. 내부 조인은 데이터 프레임을 결합하는 가장 기본적인 조인입니다. 내부 조인은 공통 속성이 있는 행만 포함하는 데이터 프레임을 반환합니다. 따라서 결합된 두 데이터 프레임 모두 공통 값을 가져야 합니다. 전체 또는 외부 조인은 왼쪽 및 오른쪽 데이터 프레임의 모든 행을 반환합니다. 즉, 두 데이터 프레임의 합집합을 제공합니다. 왼쪽 조인은 오른쪽 데이터 프레임의 일치하는 행과 함께 왼쪽 데이터 프레임의 모든 행을 반환합니다. 오른쪽 조인은 왼쪽 조인과 정확히 반대입니다. 왼쪽 데이터 프레임의 일치하는 행과 함께 오른쪽 데이터 프레임의 모든 행을 반환합니다.
행이나 열을 연결하는 다양한 방법은 무엇입니까?
두 데이터 프레임의 행 또는 열은 다음과 같은 방법으로 연결할 수 있습니다. 1. .concat()을 사용하여 DataFrame 연결 - ".concat()" 함수를 사용하는 두 행 또는 열을 연결하는 가장 간단한 방법입니다. 2. 축에 논리를 설정하여 DataFrame 연결 - 이 방법에서는 축에 다른 논리를 정의합니다. 축을 설정하는 방법은 다음과 같습니다. 합집합(join = 외부), 교집합(결합 = 내부), 특정 인덱스 사용. 3. .append()를 사용하여 DataFrame 연결 - ".append()" 함수는 ".concat()" 함수 바로 전에 사용되며 축 = 0을 따라 연결합니다. 4. 인덱스를 무시하여 DataFrame 연결 - 이 방법에서 , 의미 없는 인덱스를 무시하고 데이터 프레임을 추가합니다. 중복되는 인덱스를 무시하기 위한 인수로 ignore_index를 사용합니다.
병합 기능에 대해 무엇을 알고 있습니까?
병합 기능은 행 또는 열을 병합하기 위해 두 데이터 프레임에서 작동됩니다. 고용량 메모리 조인 작업이며 관계형 데이터베이스와 유사합니다. on = 열 이름을 사용하여 공통 열의 데이터 프레임을 병합할 수 있습니다.
left_on = 열 이름 또는 right_on = 열 이름을 업데이트하여 왼쪽 또는 오른쪽 데이터 프레임의 열을 키로 사용하여 테이블을 정렬할 수 있습니다. left_index = True 또는 right_index = True를 선택하면 왼쪽 데이터 프레임 또는 오른쪽 데이터 프레임의 행 레이블을 조인 키로 사용할 수 있습니다.