'ADsP 예상문제 3과목 - 4 영상' 공부하기
Q17. IQR
Q3-Q1
Q19. 회귀모형 - 회귀분석 가정 中 '선형성' 위배
- 선형성: line(선)형. x 따라 y변화하는. 선형회귀에서 오차는 평균이 0이고 분산이 일정한 정규분포를 가정함
=> y값은 Residuals선을 따라서기울기가 0인 직선이 이상적임
Q20. 교차분석(Cross Tabulation)
- 두 변수(범주형) 간의 연관관계를 볼 떄 교차표 작성하여 변수들 간의 관계를 분석한다.
- 사용 검정통계량 : 카이스퀘어 분포. 카이스퀘어 검정
- 교차표를 통해 두 변수의 값이 공유하고 있는 빈도수를 파악 ok
Q21. 카이제곱 분포
- 연속형 확률분포 중 카이제곱 분포(x**2)는 분산의 특징을 확률분포로 만든 것!
- 카이(x)는 평균 0, 분산 1인 표준정규분포를 의미한다.
Q22. F 통계량
- 회귀모형 해석(평가)방법 중 F 통계량은, 모델의 통계적 유의성을 검정하기 위한 검정 통계량(분산 분석)을 의미
- 회귀제곱평균(MSR) / 잔차제곱평균(MSE)
- F통계량이 클수록 회귀 모형은 통계적으로 유의함
Q25 accuracy(정확도)
- 전체 예측에서 옳은예측 비율
- precision(정밀도): 예측
- recall(재현율)=sensitivity(민감도)
Q26. 시계열 모형
- AR(p): 현 시점의 자료가 p시점 전의 유한 개의 과거 자료로 설명될 수 있는 모델 (평균 X)
- MR(q): 최근 데이터의 평균을 예측치로 사용하는 방법, 현 시점의 자료가 유한 개의 과거 백색잡음(정상시계열)의 선형결합으로 표현된 모형
Q27. 계층적 군집- 코사인유사도(cosine similarity)
- 각도가 0일떄 값은 1 (가장 큰값)
- 벡터의 크기가 아닌 방향의 유사도를 판단하는 목적으로 사용
- 방향 같을 떄(0도): 1 / 방향 직각(90도): 0 / 방향 반대(180도) -1
Q30. 분류모형 성능평가 - ROC Curve
- ROC Curve (Receiver Operating Characteristic)
- 분류 모형 성능평가에 사용되며, x축은 FP Rate(1-특이도), y축은 sensitivity(민감도)를 나타내는 이 두 평가 값의 관계로 모형을 평가하는 것.
- ROC 그래프의 밑 부분의 면적(AUC)이 넓을수록 좋은 모형으로 평가함
'😆 Big Data > - 데이터' 카테고리의 다른 글
[ADsP] ADsP 예상문제 3과목 - 2 영상 공부하기 (0) | 2022.02.25 |
---|---|
[ADsP] ADsP 예상문제 3과목 - 1 영상 공부하기 (0) | 2022.02.25 |
[ADsP] ADsP 예상문제 3과목 - 3 영상 공부하기 (0) | 2022.02.24 |
[ADsP] ADsP 예상문제 3과목 - 6 영상 공부하기 (0) | 2022.02.23 |
[ADsP] ADsP 예상문제 3과목 - 5 영상 공부하기 (0) | 2022.02.23 |