묭동이 개발 블로그
  • [Pandas] join() 메소드를 사용하여 데이터 통합하기
    2024년 01월 08일 10시 56분 29초에 업로드 된 글입니다.
    작성자: 묭동이

    안녕하세요 이번 글에서는 join() 메소드를 사용하여 데이터를 통합하는 방법에 대해서 알아보겠습니다.

     

    먼저 pandas 라이브러리를 불러옵니다.

    import pandas as pd

     

    이후 2개의 DataFrame 객체를 생성한 후 join 메소드를 통해 데이터를 통합합니다.

    concat() 메소드와의 다른 점은 join() 메소드는 "가로" 방향으로 데이터를 통합합니다.

    join() 메소드를 사용하여 가로방향으로 데이터 통합

     

    아래 코드는 concat() 코드의 실행 예시입니다.

    concat() 메소드를 사용하여 세로방향으로 데이터 통합

     

    인덱스 라벨을 지정하여 DataFrame 객체를 생성하고 데이터를 통합할 수도 있습니다

     

    데이터를 통합할 때는 주의하실 점이 있습니다. 아래와 같이 칼럼이 일치하지 않는 경우 데이터가 NaN(결측치)로 바뀌는 문제가 발생할 수 있으므로 인덱스가 일치하는지 체크한 후 데이터 통합을 하면 데이터 손실 가능성을 줄일 수 있습니다.

    인덱스 불일치로 인한 데이터 손실

     

    인덱스를 확인하는 방법은 아래와 같이 DataFrame객체.index == DataFrame객체.index를 통해 가능합니다

    원소가 boolean 타입인 배열이 반환되며 False 값이 있는 경우 병합하고자 하는 데이터들의 인덱스를 확인하여 인덱스를 일치시킨 후 병합하는 것이 데이터 손실없이 병합하는 방법이라고 생각합니다 

     

     

    틀린 부분 댓글로 작성해주시면 감사하겠습니다 😊

    댓글