- [Pandas] concat() 메소드를 사용하여 데이터 통합하기2024년 01월 08일 10시 28분 07초에 업로드 된 글입니다.작성자: 묭동이
안녕하세요 이번 글에서는 pandas library를 사용하여 데이터 통합하는 방법을 알아보겠습니다.
DB(데이터베이스)에 저장되어있는 2개 이상의 테이블을 조인하여 데이터를 통합하는 것과 유사하다고 이해해주시면 됩니다 !
먼저 필요한 라이브러리를 불러와줍니다
pandas 라이브러리를 사용하므로 pandas 라이브러리를 import 해주도록 하겠습니다.
import pandas as pd
이후 아래와 같이 임의의 데이터프레임 객체 2개를 생성합니다
append() 메소드를 사용하면 df1에 df2의 DataFrame 객체를 병합할 수 있다고 나와있어서 코드를 실행했는데 아래와 같은 에러가 발생했습니다 !..
이때는 당황하지 않고 공식문서로 가주도록 합니다
공식 문서에 나와있는 내용을 보니 pandas 1.4.0 버전 이후로는 append()를 지원하지 않는다고 합니다.
이 문제를 해결하는 방법은 크게 두가지가 있는데요, 버전 불일치로 인한 메소드, 클래스 에러는 자주 일어나니 잘 봐주시면 좋겠습니다
- 1. pandas 버전을 다운그레이드(낮춰서)하여 append() 메소드를 사용합니다.
- 2. 작성한 코드를 새로운 버전에 맞춰서 코드 재수정을 합니다.
저는 공식문서에 concat() 메소드를 사용하라고 나와있어 링크로 들어가 사용법을 확인해보겠습니다
아래 공식문서 링크에서는 Series 객체와 DataFrame 객체 모두 concat() 메소드 사용이 가능하다고 나와있지만,
위에서 만든 DataFrame 객체 2개를 병합하는 것이 목표이므로 DataFrame 부분을 참고하여 병합해보도록 하겠습니다.
concat() 메소드 링크
https://pandas.pydata.org/pandas-docs/version/1.4/reference/api/pandas.concat.html#pandas.concat
concat() 메소드를 사용하실 때 인자를 리스트 형태로 넣는 것을 확인할 수 있습니다.
메소드 실행결과를 새로운 변수 result에 저장하고 출력결과를 확인하니 잘 나온 것을 확인할 수 있습니다 !
그런데, 인덱스 번호가 뒤죽박죽 나온 것을 확인할 수 있는데요 ignore_index=True 옵션을 통해 인덱스 번호를 초기화 시킬 수 있습니다.
틀린 부분 댓글로 작성해주시면 감사하겠습니다 😊
Reference
'Data Analystics > pandas' 카테고리의 다른 글
[Pandas] merge() 메소드를 사용하여 데이터 병합하기 (4) 2024.01.08 [Pandas] join() 메소드를 사용하여 데이터 통합하기 (0) 2024.01.08 [Pandas] manipulate textual data(문자형 데이터 다루기) (2) 2024.01.06 [Pandas] File Handling (2) 2024.01.05 [Pandas] library DataFrame .loc condition(조건문) (0) 2024.01.05 다음글이 없습니다.이전글이 없습니다.댓글