728x90

전체 글 373

[ELK] ⚒️12장 리눅스 실습 환경구성 - (Ubuntu + VM VirtualBox)

12장 리눅스 실습 환경구성 - (Ubuntu + VM VirtualBox) - 12.1 버추얼박스에서 우분트 설치하기 - 교재의 가장 처음부터가 아닌 , 461쪽 을 가장 먼저 시작하려한다. 평소 VM virtualbox + 리눅스 CentOS7으로 환경구성을 한 뒤 ELK를 설치했지만, Ubuntu를 사용하고 싶어서!! 일단 VM VirtualBox는 설치하는 방법은 쉬우니, Ubuntu 설치부터 포스팅해보려한다! (*버추얼박스 설정은 특별히 수정할 것이 없다. 그냥 다운로드 받아서 설치만 하면 된다.) 현재 나의 버츄얼박스 버젼은 6.1.32 ⚒️12.1.1 우분트 다운로드 1. 구글 검색창에 'ubuntu' 검색하기 - 다운로드 페이지가 가장 먼저 나온다. 클릭해서 접속! https://ubunt..

🍯32회차 데이터분석 준전문가(ADsP) 시험후기! 🐝

🍯 꿀주말 알차게 보내기! 데이터분석 준전문가(ADsP) 시험보기! 🐝 🐝 2월 마지막 주 주말 알차게 보내기 벌써 2월 마지막 주! 데이터분석가 과정을 배운지 2달이 되가는 시점 빅데이터 분석기사까지는 아니지만, 데이터분석 자격증에 도전해보기로 했다... 아! 물론 준전문가로 ㅋㅋㅋㅋㅋ 오늘 지참했던 나이 수험표를 가져와 봤다! 아! 시험은 용산철도고에서 시험을 봤는데, 시험장이 엄청 좋았다! 시험장으로 추천추천! ⭐ x 1000000000 용산역에서 바로 보이는 호반서밋 옆에 있기에 느린걸음으로 7분만 걸어가면 되고 무엇보다 책상과 의자 너무너무 좋았고! 수험표에 보다시피 3월 25일 금요일에 나온다는데, 한달이나 기다려야했다... ㅎ 지금 합격을 할지 안할지는 살짝 애매한 상태 🐝 시험내용을 말해보..

[ELK] 『엘라스틱 스택 개발부터 운영까지』좋은 책 발견!!😳

『 엘라스틱 스택 개발부터 운영까지 』 데이터 수집, 변환, 분석, 시각화를 위한 엘라스틱서치, 로그스태시, 비츠, 키바나의 모든 것 📖 왜 이 책을 읽기 시작했나.....? * 나에게 ELK STACK은 - 2~3주간 배웠던 데이터 파이프라인 구축을 배우면서, ELK STACK이 엄청 좋은 플랫폼이라는 걸 깨달았기 때문에 ! - 나의 Tech skill로 습득하고 싶은 것! * ELK에 대해 너무 잘 소개 되었기에! - 최신 version의 ELK STACK을 기준으로 설명해줌 - 직접 실습할 수 있는 예제들이 잘 되어있기에! 📖 차례 1부 | 엘라스틱 스택 개요 1장 엘라스틱 스택이란 2장 윈도우 실습 환경 구성 2부 | 엘라스틱 스택 구성요소 4장 엘라스틱서치: 검색 5장 엘라스틱서치: 집계 6장 ..

[8주차] 🖥️데이터 EDA (Pandas, Matplotlib, Seaborn) 수업 & 시험

🐼 데이터분석 Skill 레벨업 EDA를 잘하기 위해서-!! 📈 EDA (Explorary Data Analysis, 탐색적 데이터 분석) 데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 '탐색과 이해'를 기본으로 가져야 한다는 것! 데이터 EDA (Pandas, Matplotlib, Seaborn) Skill은 너무나 중요한 Skill이었다. 그렇기 때문에, 이번 주에 배운 것은 너무 값진 것이었다. 사실 판다스에 대해 나름 독학했다고 했지만, groupby/pivot_table 만들거나, stack/unstack는 많이 연습하지 않았는데 확실하게 잘 배울수 있었다 ㅎㅎㅎ 그래서 너---무 좋았다!🙂 🐼 EDA 시험 후기!! 시험은 T/F로... 엄청 쉽다고 했는데..... ..

[ADsP] ADsP 예상문제 3과목 - 2 영상 공부하기

'ADsP 예상문제 3과목 - 2 영상' 공부하기 Q15. 데이터 전처리 - 스케일링 - Min-Max Nomalization: 데이터 전처리 방법 중 데이터를 일정범위로 Feature scaling 범위 0~1사이로 적용해주고 원 데이터 분포를 유지하는 정규화 방법 - Standardization: 평균 0, 표준편차 1인 표준 정규분포를 변환하는 것 Q16. 결측값(missing value)처리에 대한 대치법 - complete case analysis: 결측값은 삭제. 불완전 자료는 모두 무시하고 완전하게 관측된 자료만으로 표준적 통계기법에 의해 분석하는 방법 - 평균대치법(mean imputation): 관측/실험결과자료의 적절한 평균값으로 결측값 대치하여 완전한 자료로 만든 후,--> 완전한 자..

[ADsP] ADsP 예상문제 3과목 - 1 영상 공부하기

'ADsP 예상문제 3과목 - 1 영상' 공부하기 Q1. 모수적 추론 - F-분포 * F-분포란 : 두 집단의 분산이 같은 지를 검정할 때 사용된다. * 모평균과 표본평균과의 차이 : z-분포, t-분포 * 모분산과 표본분산과의 차이: F-분포(집단 2개), 카이제곱(x^2)분포(집단 1개) Q2. 집중화 경향 측정 - 집중 경향치(평균, 중앙값, 최빈값)에서 이상값 및 다른 관측값에 의한 영향에 민감한 것을 '평균'이다. Q3. 자료의 척도 - 명목척도: 단순히 대상특성 분류 / 확인 모적 - 서열척도: 대소/고저 등 순위만 제공, 양적비교불가 ex)금은동, 상중하 - 등간척도: 순위를 부여하되, 간격동일. 양적비교 가능 ex)기온, 물가지수 ----> 기온의 0도와 절대 0점과의 개념은 다르다. - ..

[Pandas] EDA 자주 사용하는 코드 모아보기 😆

Pandas EDA 자주 사용하는 코드 모아보기 😆 지금까지 배우고 공부했던 pandas 함수를 정리해볼겸, EDA를 하면서 자주 사용했던 함수를 정리해보려한다. 😉 Basic import pandas as pd : 판다스 임포트 (Series와 DataFrame을 다루려면!) import numpy as np : 넘파이 임포트 -> 주로 np.nan (결측값)을 다루기 위해서 사용 import matplotlib.pyplot as plt : 맷플롯립 임포트 import seaborn as sns : 씨본 임포트 Pandas 자료구조 *df = 데이터 프레임 * df.index : df 인덱스 확인 * df.columns: df 열 확인 * df.values: df 값 확인 * df.shape: df 행..

[Pandas] Pandas 연습 문제 풀기 -8 🐼 (결측치, datetime, groupby 등)

Pandas 연습 문제 풀기 -8 🐼 In [1]: # 라이브러리 임포트 import pandas as pd 데이터 알아보기¶ In [2]: import os os.listdir('./data') Out[2]: ['2014-baby-names-illinois.csv', '2015-baby-names-illinois.csv', 'billboard.csv', 'country_timeseries.csv', 'nav_2018.csv', 'pew.csv', 'stock price.xlsx', 'stock valuation.xlsx', 'tb-raw.csv', 'titles.csv', 'weather.csv'] In [3]: # 파일 './data/nav_2018.csv'를 encoding='utf-8'으로 불러와..

[Pandas] Pandas 연습 문제 풀기 -7 🐼

Pandas 연습 문제 풀기 -7 🐼 실습¶ In [1]: # dataframe import pandas as pd # 인구수:population, 땅넓이: area, 수도:capital data = {'country': ['Belgium', 'France', 'Germany', 'Netherlands', 'United Kingdom'], 'population': [11.3, 64.3, 81.3, 16.9, 64.9], 'area': [30510, 671308, 357050, 41526, 244820], 'capital': ['Brussels', 'Paris', 'Berlin', 'Amsterdam', 'London']} countries = pd.DataFrame(data) countries = cou..

[ADsP] ADsP 예상문제 3과목 - 4 영상 공부하기

'ADsP 예상문제 3과목 - 4 영상' 공부하기 Q17. IQR Q3-Q1 Q19. 회귀모형 - 회귀분석 가정 中 '선형성' 위배 - 선형성: line(선)형. x 따라 y변화하는. 선형회귀에서 오차는 평균이 0이고 분산이 일정한 정규분포를 가정함 => y값은 Residuals선을 따라서기울기가 0인 직선이 이상적임 Q20. 교차분석(Cross Tabulation) - 두 변수(범주형) 간의 연관관계를 볼 떄 교차표 작성하여 변수들 간의 관계를 분석한다. - 사용 검정통계량 : 카이스퀘어 분포. 카이스퀘어 검정 - 교차표를 통해 두 변수의 값이 공유하고 있는 빈도수를 파악 ok Q21. 카이제곱 분포 - 연속형 확률분포 중 카이제곱 분포(x**2)는 분산의 특징을 확률분포로 만든 것! - 카이(x)는 ..

728x90