본문 바로가기
Language/Python

pd.merge 함수

by Mesut Özil 2024. 1. 1.

pd.merge

pd.merge 함수는 pandas에서 사용되는 데이터프레임 합(merge)하는 함수입니다.

이 함수는 SQL JOIN 연산 유사한 동작을 합니다.

다양한 파라미터를 제공하여 다양한 유형의 병합을 수행할 수 있습니다.

 

기본 구조

  • pd.merge(df1, df2)
  • df1.merge(df2) (위와 동일한 결과 반환)
  • df1, df2는 병합할 두 데이터프레임을 의미

 

아래는 pd.merge() 함수의 주요 파라미터들입니다.

 

1. how

병합(조인) 방법을 지정합니다. 선택사항으로  default = 'inner' (내부 조인)

  1. 'inner': 공통된 열(조인 키)에 대해 일치하는 행만을 포함하며, df1과 df2 간의 교집합을 반환
  2. 'outer': df1과 df2의 모든 행을 포함하는 합집합을 반환
  3. 'left': 왼쪽 df1모든 행 포함하며, 오른쪽 df2와 공통된 열의 일치하는 행만 추가(일치 행 없는 경우 NaN)
  4. 'right': 오른쪽 df1모든 행 포함하며, 왼쪽 df2와 공통된 열의 일치하는 행만 추가(일치 행 없는 경우 NaN)
  5. 'cross': df1df2모든 행을 포함


2. on, left_on, right_on

조인에 사용할 열을 지정

  1. on: 양쪽 데이터프레임에 공통된 열 이름이 있는 경우에 사용하며,
  2. left_on, right_on: 서로 다른 열 이름을 갖는 경우에 사용


3. left_index, right_index

인덱스조인 키사용할지 여부를 지정합니다.

두 데이터프레임인덱스 공통으로 가지고 있는 경우에 사용


4. suffixes

컬럼 이름 충돌 시, 각 데이터프레임의 컬럼추가될 접미사를 지정


5. sort

조인 키를 기준으로 결과를 정렬할지 여부를 나타내는 불리언 값

 

 

 

본 게시글은 ChatGPT의 도움을 받아 작성하였습니다.

'Language > Python' 카테고리의 다른 글

scipy 라이브러리  (0) 2024.01.16
os 모듈  (0) 2024.01.15
pd.concat 함수  (0) 2023.12.30
chr 함수, ord 함수 (시저 암호)  (0) 2023.12.28
Fraction 클래스  (2) 2023.12.27