Pandas의 기존 데이터 프레임에 새 열 추가 [2022]

게시 됨: 2021-01-06

해석된 범용 고급 프로그래밍 언어인 Python은 방대한 라이브러리 컬렉션과 구현하기 쉬운 특성으로 인해 최근 경이적인 컴퓨팅 언어가 되었습니다. Python의 인기는 데이터 과학 및 데이터 분석의 구현과 함께 엄청난 도약을 했습니다. Python과 통합하여 모든 분야에서 효율적으로 작동할 수 있는 수천 개의 라이브러리가 있습니다.

Pandas 는 Python이 데이터 조작 및 데이터 분석을 수행하도록 명시적으로 설계된 데이터 분석 라이브러리 중 하나입니다. Pandas 라이브러리는 숫자 테이블을 처리하고, 데이터를 분석하고, 시계열로 작업하기 위한 특정 데이터 구조 및 작업으로 구성됩니다. 이 기사에서는 이미 존재하는 Pandas의 DataFrame에 열을 추가 하는 방법을 알게 될 것입니다.

읽기: Pandas Dataframe Astype

목차

데이터프레임이란?

기존 DataFrame에 새 열을 추가하는 방법을 알기 전에 먼저 Pandas 의 DataFrames를 살펴보겠습니다. DataFrame은 레이블이 지정된 축(행 및 열)과 함께 이종 값을 저장할 수 있는 2차원 배열 형태의 가변 데이터 구조입니다. DataFrame은 데이터가 테이블 형식(교차 행과 열)의 논리적 배열로 저장된 상태로 유지되는 데이터 구조입니다. DataFrame의 세 가지 주요 구성 요소는 행, 열 및 데이터입니다. Python에서 DataFrame을 만드는 것은 매우 쉽습니다.

pandas를 pd로 가져오기

l = ['This', 'is', 'a', 'List', 'preparing', 'for', 'DataFrame']

datfr = pd.DataFrame(l)

인쇄(datfr)

위의 프로그램은 7행 1열의 DataFrame을 생성합니다.

Pandas의 기존 데이터 프레임

기존 DataFrame에 열을 추가하는 방법은 무엇입니까?

Pandas 에서 DataFrame에 새 열을 추가하는 다양한 방법이 있습니다. 우리는 이미 Pandas 라이브러리를 사용하여 기본 DataFrame을 만드는 방법에 대한 아이디어를 모았습니다. 이제 이미 존재하는 라이브러리를 준비하고 작업해 보겠습니다.

pandas를 pd로 가져오기

# 전문가의 데이터가 포함된 사전 정의

datfr = {'이름': ['칼', '가우라브', '레이', '미모'],

'높이': [6.2, 5.7, 6.1, 5.9],

'지정': ['과학자', '교수', '데이터 분석가', '보안 분석가']}

df = pd.DataFrame(datfr)

인쇄(df)

산출:

읽기: Python Pandas 자습서

기법 1: insert() 메서드

이제 기존 DataFrame에 새 열을 추가하려면 insert() 메서드를 사용해야 합니다. insert() 메소드를 구현하기 전에 작동에 대해 알려주십시오. DataFrame.insert()를 사용하면 데이터 분석가가 원하는 모든 위치에 열을 추가할 수 있습니다. 또한 열 값을 주입하기 위한 여러 가능성을 수용합니다. 프로그래머는 인덱스를 지정하여 해당 특정 위치에 데이터 열을 삽입할 수 있습니다.

pandas를 pd로 가져오기

# 전문가의 데이터가 포함된 사전 정의

datfr = {'이름': ['칼', '가우라브', '레이', '미모'],

'높이': [6.2, 5.7, 6.1, 5.9],

'지정': ['과학자', '교수', '데이터 분석가', '보안 분석가']}

df = pd.DataFrame(datfr)

df.insert(3, "나이", [40, 33, 27, 26], True)

인쇄(df)

첫 번째 매개변수로 insert() 메서드에 정의된 세 번째 인덱스 위치에 'Age' 열을 추가합니다.

기법 2: assign() 메서드

DataFrame에 열을 추가하는 또 다른 방법은 Pandas 라이브러리의 assign() 메서드를 사용하는 것입니다. 이 방법은 다른 접근 방식을 사용하여 기존 DataFrame에 새 열을 추가합니다. Dataframe.assign()은 열과 함께 새 DataFrame을 생성합니다. 그런 다음 기존 DataFrame에 추가합니다.

pandas를 pd로 가져오기

datfr = {'이름': ['칼', '가우라브', '레이', '미모'],

'높이': [6.2, 5.7, 6.1, 5.9],

'지정': ['과학자', '교수', '데이터 분석가', '보안 분석가']}

dfI = pd.DataFrame(datfr)

dfII = dfI.assign(위치 = ['노이다', '암스테르담', '캠브리지', '방갈로르'])

인쇄(dfII)

산출:

기술 3: 열로 새 목록 만들기

프로그래머 가 DataFrame에 열을 추가하는 데 사용할 수 있는 마지막 방법은 새 목록을 별도의 데이터 열로 생성하고 기존 DataFrame에 열을 추가하는 것입니다.

pandas를 pd로 가져오기

datfr = {'이름': ['칼', '가우라브', '레이', '미모'],

'높이': [6.2, 5.7, 6.1, 5.9],

'지정': ['과학자', '교수', '데이터 분석가', '보안 분석가']}

df = pd.DataFrame(datfr)

loc = ['노이다', '암스테르담', '캠브리지', '방갈루루']

df['위치'] = 위치

인쇄(df)

산출:

체크아웃: Pandas 인터뷰 질문

결론

데이터 분석가는 열 단위 형식으로 데이터 집합을 추가하기 위한 기본 작업을 수행합니다. 데이터 분석가나 프로그래머가 Pandas 의 기존 DataFrame에 새 열을 추가하는 데 사용할 수 있는 다양한 접근 방식이 있습니다. 이러한 방법을 사용하면 프로그래머가 Pandas 데이터를 분석하는 동안 언제든지 데이터 열을 쉽게 추가할 수 있습니다.

Pandas의 DataFrame에 대해 자세히 알아보려면 작업 전문가를 위해 만들어졌으며 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크샵, 업계 전문가와의 멘토링, 업계 멘토와의 1:1 학습, 400시간 이상의 학습 및 최고의 기업과의 취업 지원.

Pandas가 Python에서 데이터 프레임을 생성하는 데 가장 선호되는 라이브러리 중 하나인 이유는 무엇입니까?

Pandas 라이브러리는 데이터 프레임을 효율적으로 생성할 수 있는 다양한 기능을 제공하므로 데이터 프레임 생성에 가장 적합한 것으로 간주됩니다. 이러한 기능 중 일부는 다음과 같습니다. Pandas는 효율적인 데이터 표현을 허용할 뿐만 아니라 이를 조작할 수 있는 다양한 데이터 프레임을 제공합니다. 데이터에 레이블을 지정하고 구성하는 지능적인 방법을 제공하는 효율적인 정렬 및 인덱싱 기능을 제공합니다. Pandas의 일부 기능은 코드를 깔끔하게 만들고 가독성을 높여 더 효율적으로 만듭니다. 또한 여러 파일 형식을 읽을 수 있습니다. JSON, CSV, HDF5 및 Excel은 Pandas에서 지원하는 파일 형식 중 일부입니다. 여러 데이터 세트를 병합하는 것은 많은 프로그래머에게 진정한 도전이었습니다. Pandas는 이것을 극복하고 여러 데이터 세트를 매우 효율적으로 병합합니다. Pandas는 Matplotlib 및 NumPy와 같은 다른 중요한 Python 라이브러리에 대한 액세스도 제공하므로 매우 효율적인 라이브러리입니다.

Pandas 라이브러리가 작동하는 다른 Python 라이브러리는 무엇입니까?

Pandas는 데이터 프레임을 생성하기 위한 중앙 라이브러리로 작동할 뿐만 아니라 Python의 다른 라이브러리 및 도구와도 함께 작동하여 더 효율적입니다. Pandas는 대부분의 Pandas 라이브러리 구조가 NumPy 패키지에서 복제되었음을 나타내는 NumPy Python 패키지를 기반으로 합니다. Pandas 라이브러리의 데이터에 대한 통계 분석은 SciPy에 의해 운영되고 Matplotlib에 함수를 표시하고 Scikit-learn에 머신 러닝 알고리즘이 적용됩니다. Jupyter Notebook은 IDE로 작동하며 Pandas에 좋은 환경을 제공하는 웹 기반 대화형 환경입니다.

삽입과 함께 Dataframe의 기본 작업은 무엇입니까?

추가 또는 삭제와 같은 작업을 시작하기 전에 인덱스 또는 열을 선택하는 것이 중요합니다. 데이터 프레임에서 값에 액세스하고 열을 선택하는 방법을 배우고 나면 Pandas 데이터 프레임에서 인덱스, 행 또는 열을 추가하는 방법을 배울 수 있습니다. 데이터 프레임의 인덱스가 원하는 대로 나오지 않으면 재설정할 수 있습니다. 인덱스를 재설정하려면 "reset_index()" 함수를 사용할 수 있습니다.