pd.merge
pd.merge 함수는 pandas에서 사용되는 데이터프레임을 병합(merge)하는 함수입니다.
이 함수는 SQL의 JOIN 연산과 유사한 동작을 합니다.
다양한 파라미터를 제공하여 다양한 유형의 병합을 수행할 수 있습니다.
기본 구조
- pd.merge(df1, df2)
- df1.merge(df2) (위와 동일한 결과 반환)
- df1, df2는 병합할 두 데이터프레임을 의미
아래는 pd.merge() 함수의 주요 파라미터들입니다.
1. how
병합(조인) 방법을 지정합니다. 선택사항으로 default = 'inner' (내부 조인)
- 'inner': 공통된 열(조인 키)에 대해 일치하는 행만을 포함하며, df1과 df2 간의 교집합을 반환
- 'outer': df1과 df2의 모든 행을 포함하는 합집합을 반환
- 'left': 왼쪽 df1의 모든 행을 포함하며, 오른쪽 df2와 공통된 열의 일치하는 행만 추가(일치 행 없는 경우 NaN)
- 'right': 오른쪽 df1의 모든 행을 포함하며, 왼쪽 df2와 공통된 열의 일치하는 행만 추가(일치 행 없는 경우 NaN)
- 'cross': df1과 df2의 모든 행을 포함
2. on, left_on, right_on
조인에 사용할 열을 지정
- on: 양쪽 데이터프레임에 공통된 열 이름이 있는 경우에 사용하며,
- left_on, right_on: 서로 다른 열 이름을 갖는 경우에 사용
3. left_index, right_index
인덱스를 조인 키로 사용할지 여부를 지정합니다.
두 데이터프레임이 인덱스를 공통으로 가지고 있는 경우에 사용
4. suffixes
컬럼 이름 충돌 시, 각 데이터프레임의 컬럼에 추가될 접미사를 지정
5. sort
조인 키를 기준으로 결과를 정렬할지 여부를 나타내는 불리언 값
본 게시글은 ChatGPT의 도움을 받아 작성하였습니다.
'Language > Python' 카테고리의 다른 글
scipy 라이브러리 (0) | 2024.01.16 |
---|---|
os 모듈 (0) | 2024.01.15 |
pd.concat 함수 (0) | 2023.12.30 |
chr 함수, ord 함수 (시저 암호) (0) | 2023.12.28 |
Fraction 클래스 (2) | 2023.12.27 |