- [ Data Analystics/visualization ][seaborn] boxplot 그래프를 통해 이상치 확인하고 제거하기 (2)2024-01-12 22:44:41본 글은 Evan Jung님의 Udemy "데이터분석 필수, Python Streamlit을 활용한 대시보드 만들기" 강의를 수강 후 정리해 작성하였습니다. 안녕하세요 [seaborn] boxplot 그래프를 통해 이상치 확인하고 제거하기 (1)에 이어서 이번 글에서는 사용자 정의 함수를 통해 이상치를 처리하는 방법과 seaborn 라이브러리를 활용하여 두 개의 boxplot 그래프를 그리는 것을 알아보겠습니다 ! 이상치 제거 함수 만들기 먼저 필요한 라이브러리를 불러오도록 하겠습니다. import pandas as pd 이후 remove_outliers_iqr 이름의 이상치 제거 함수를 정의하였습니다. [seaborn] boxplot 그래프를 통해 이상치 확인하고 제거하기 (1)에서 다뤘던 이상치 제..
- [ Data Analystics/visualization ][seaborn] boxplot 그래프를 통해 이상치 확인하고 제거하기 (1)2024-01-11 23:15:10본 글은 Evan Jung님의 Udemy "데이터분석 필수, Python Streamlit을 활용한 대시보드 만들기" 강의를 수강 후 정리해 작성하였습니다. 안녕하세요 이번 글에서는 seaborn 라이브러리를 활용해 boxplot 그래프를 통해 이상치를 확인하고 제거하는 방법에 대해 알아보겠습니다. 먼저 필요한 라이브러리를 불러오도록 하겠습니다. 이후 data 폴더에 저장되어 있는 raw_sales.csv 파일을 read_csv 메소드를 사용하여 불러오도록 하겠습니다. parse_dates 매개변수? pandas의 read_csv 메소드를 사용할 때 parse_dates 매개변수는 지정된 컬럼들의 데이터를 파이썬 datetime 객체로 변환해줍니다. CSV 파일에 날짜 정보가 문자열 형태로 저장되어 있을..
- [ Data Analystics/visualization ][matplotlib] 시각화 기초(선 그래프)2024-01-07 16:58:46안녕하세요 이번 글에서는 matplotlib 라이브러리를 이용해서 간단한 시각화를 하는 방법을 다뤄보겠습니다 먼저 필요한 라이브러리를 불러오도록 하겠습니다 import matplotlib.pyplot as plt data1 변수에 임의로 데이터를 넣은 후 그래프를 그려보았습니다. x축은 data1의 인덱스 값을, y축은 data1의 인덱스에 해당하는 값을 나타내며 그래프는 직선형태임을 알 수 있습니다. 그러나, 해당 방식은 OOP(객체지향프로그래밍) 방식의 코드가 아닙니다. 파이썬은 객체지향언어이므로 저는 계속해서 위의 방식이 아닌 객체지향방식의 코드를 통해 시각화를 해보겠습니다. 시각화를 할 때 가장 먼저 작성해주셔야 하는 코드는 아래 코드입니다. 그림을 그릴때 사용하는 흰 도화지라고 이해해주시면 됩니..