😎 프로젝트 만들기/- EDA(kaggle,etc)

[ELK] ELK활용 미니프로젝트 - 데이터 전처리 (feat. pandas)

또방91 2021. 12. 17. 15:18
728x90

 

 

 

 

 

 

 

💻 데이터 전처리

 

 

 

내려받은 자료는 내가 원하는 필터링을 거쳐 수집이 가능하긴 했지만

아쉽게도 내가 원하는 형태로는 수집받지 못했다...😥

 

그러니 이럴 때 필요한 건 뭐다??

데이터 전처리!!!!!

 

다행히 pandas 공부를 조금 했어서 데이터 전처리를 통해

원하는 형태를 만들 수 있었다.

 

 

바로바로 디버깅을 하면서 처리가 잘되어 가고 있나 화인하기 위해,

바로 VS code로 작성하지 않고

colab을 사용하여 확인하면서 전처리를 해나갔다.

 

전처리 1차로는 < 연도별 * 월 > 형식으로 데이터 프레임을 뽑고

전처리 2차로는 < 세대별 * 월 > 형식으로 데이터 프레임을 뽑을 것이다.

 

 

** Github에 들어가면 중간중간 실행결과가 뜨니 꼭 들어가 참고해보길 바란다!!

df1(연도별): https://github.com/LIMSONA/K-Digital-Training/blob/main/ELK_project_DateFrame_birth_data.ipynb

df2(세대별): https://github.com/LIMSONA/K-Digital-Training/blob/main/ELK_project_DateFrame2_birth_data.ipynb

 

 

 

🍋 KOSIS에서 다운 받은 csv 파일 즉, df 데이터프레임은 

 

 

 

🍋 df을 전처리 한 1차 연도별 df2 데이터프레임은

 

🍋 df을 전처리한 2차 세대별 df2 데이터프레임은

 

 

 

각 데이터 프레임들은 csv 파일로 저장해놓아서, 이제 ELK로 보낼 준비를 하였다!!!

 

 

 

 

🤞🍀

 

 

728x90