728x90
💻 데이터 전처리
내려받은 자료는 내가 원하는 필터링을 거쳐 수집이 가능하긴 했지만
아쉽게도 내가 원하는 형태로는 수집받지 못했다...😥
그러니 이럴 때 필요한 건 뭐다??
데이터 전처리!!!!!
다행히 pandas 공부를 조금 했어서 데이터 전처리를 통해
원하는 형태를 만들 수 있었다.
바로바로 디버깅을 하면서 처리가 잘되어 가고 있나 화인하기 위해,
바로 VS code로 작성하지 않고
colab을 사용하여 확인하면서 전처리를 해나갔다.
전처리 1차로는 < 연도별 * 월 > 형식으로 데이터 프레임을 뽑고
전처리 2차로는 < 세대별 * 월 > 형식으로 데이터 프레임을 뽑을 것이다.
** Github에 들어가면 중간중간 실행결과가 뜨니 꼭 들어가 참고해보길 바란다!!
df1(연도별): https://github.com/LIMSONA/K-Digital-Training/blob/main/ELK_project_DateFrame_birth_data.ipynb
df2(세대별): https://github.com/LIMSONA/K-Digital-Training/blob/main/ELK_project_DateFrame2_birth_data.ipynb
🍋 KOSIS에서 다운 받은 csv 파일 즉, df 데이터프레임은
🍋 df을 전처리 한 1차 연도별 df2 데이터프레임은
🍋 df을 전처리한 2차 세대별 df2 데이터프레임은
각 데이터 프레임들은 csv 파일로 저장해놓아서, 이제 ELK로 보낼 준비를 하였다!!!
🤞🍀
728x90
'😎 프로젝트 만들기 > - EDA(kaggle,etc)' 카테고리의 다른 글
[ELK] ELK활용 미니프로젝트 - 마무리하면서 느낀 점 (0) | 2021.12.24 |
---|---|
[ELK] ELK활용 미니프로젝트 - 시각화 및 대시보드 만들기 (0) | 2021.12.23 |
[ELK] ELK활용 미니프로젝트 - ELK 하나씩 구성해가기 (0) | 2021.12.23 |
[ELK] ELK활용 미니프로젝트 - 데이터 수집( KOSIS 국가통계포털) (0) | 2021.12.17 |
[ELK] ELK활용 미니프로젝트 - 프로젝트 구상 (feat. 굿노트) (0) | 2021.12.17 |