😆 Big Data/- 데이터

[ADsP] ADsP 예상문제 3과목 - 4 영상 공부하기

또방91 2022. 2. 24. 08:57
728x90

 

'ADsP 예상문제 3과목 - 4 영상' 공부하기

 

 

 

 

 

Q17. IQR

Q3-Q1

 

Q19. 회귀모형 - 회귀분석 가정 中 '선형성' 위배 

 

 

 

 

 

 

 

 

- 선형성: line(선)형. x 따라 y변화하는. 선형회귀에서 오차는 평균이 0이고 분산이 일정한 정규분포를 가정함

=> y값은 Residuals선을 따라서기울기가 0인 직선이 이상적임

 

Q20. 교차분석(Cross Tabulation)

- 두 변수(범주형) 간의 연관관계를 볼 떄 교차표 작성하여 변수들 간의 관계를 분석한다.

- 사용 검정통계량 : 카이스퀘어 분포. 카이스퀘어 검정

- 교차표를 통해 두 변수의 값이 공유하고 있는 빈도수를 파악 ok

 

Q21. 카이제곱 분포

- 연속형 확률분포 중 카이제곱 분포(x**2)는 분산의 특징을 확률분포로 만든 것!

- 카이(x)는 평균 0, 분산 1인 표준정규분포를 의미한다.

 

Q22. F 통계량

- 회귀모형 해석(평가)방법 중 F 통계량은, 모델의 통계적 유의성을 검정하기 위한 검정 통계량(분산 분석)을 의미

- 회귀제곱평균(MSR) / 잔차제곱평균(MSE)

- F통계량이 클수록 회귀 모형은 통계적으로 유의함

 

Q25 accuracy(정확도)

- 전체 예측에서 옳은예측 비율

 

- precision(정밀도): 예측

- recall(재현율)=sensitivity(민감도)

 

 

Q26. 시계열 모형

- AR(p): 현 시점의 자료가 p시점 전의 유한 개의 과거 자료로 설명될 수 있는 모델 (평균 X)

- MR(q): 최근 데이터의 평균을 예측치로 사용하는 방법, 현 시점의 자료가 유한 개의 과거 백색잡음(정상시계열)의 선형결합으로 표현된 모형

 

Q27. 계층적 군집- 코사인유사도(cosine similarity)

- 각도가 0일떄 값은 1 (가장 큰값)

-​ 벡터의 크기가 아닌 방향의 유사도를 판단하는 목적으로 사용

- 방향 같을 떄(0도): 1 / 방향 직각(90도): 0 / 방향 반대(180도) -1

 

Q30. 분류모형 성능평가 - ROC Curve

- ROC Curve (Receiver Operating Characteristic)

- 분류 모형 성능평가에 사용되며, x축은 FP Rate(1-특이도), y축은 sensitivity(민감도)를 나타내는 이 두 평가 값의 관계로 모형을 평가하는 것.

- ROC 그래프의 밑 부분의 면적(AUC)이 넓을수록 좋은 모형으로 평가함

 

 

728x90