😆 Big Data/- 데이터

[ADsP] ADsP 예상문제 3과목 - 1 영상 공부하기

또방91 2022. 2. 25. 09:15
728x90

 

 

 

 

'ADsP 예상문제 3과목 - 1 영상' 공부하기

 

 

 

Q1. 모수적 추론 - F-분포

* F-분포란 : 두 집단의 분산이 같은 지를 검정할 때 사용된다.

* 모평균과 표본평균과의 차이 : z-분포, t-분포

* 모분산과 표본분산과의 차이: F-분포(집단 2개), 카이제곱(x^2)분포(집단 1개)

 

Q2. 집중화 경향 측정

- 집중 경향치(평균, 중앙값, 최빈값)에서 이상값 및 다른 관측값에 의한 영향에 민감한 것을 '평균'이다.

 

Q3. 자료의 척도

- 명목척도: 단순히 대상특성 분류 / 확인 모적

- 서열척도: 대소/고저 등 순위만 제공, 양적비교불가 ex)금은동, 상중하

- 등간척도: 순위를 부여하되, 간격동일. 양적비교 가능 ex)기온, 물가지수

----> 기온의 0도와 절대 0점과의 개념은 다르다.

- 비율척도: 절대0점이 존재하여 측정값 사이 비율계산가능

 

Q4. 연관규칙 측정지표

향상도 

++ 지지도/ 신뢰도랑 같이 알아두기!

 

Q7. 모형평가

- k-fold 교차검증: 주어진 데이터를 가지고 반복적으로 성과를 측정 -> 그 결과를 평균 [ 분류분석모형평가기법]

- 홀드아웃: 원천데이터를 랜덤하게 두 분류로 분리하여 교차검정실시

- bootstrap: 훈련용자료를 반복 재선정하면서 평가를 반복한다.

(cf. 교차검증은 훈련용 자료를 반복 재선정하지 않음!)

 

Q10. 주성분 분석

scale=TRUE 로 되어있으면 상관행렬을 사용한 것!

 

Q11. 지니지수

1 - (각 범주별 경우의 수 제곱의 합)

 

Q12. 데이터 마이닝 기법

- 분류: 기존의 분류,정의된 집합에 배정하는 것

- 추정: 알려지지 않은 결과의 값을 추정하는 것

- 예측: 미래에 대한 것을 예측, 추정하는 것을 제외하면 분류나 추정과 동일한 의미

- 기술: 데이터가 가진 특징 및 의미를 단순하게 설명하는 것

 

Q13. 신뢰구간

- 관측치의 크기가 커지면 신뢰구간의 길이가 줄어든다(반비례)

- 구간추정: 모수의 참값이 포함되어 있을것이라 추정되는 구간을 결정

 

Q14. 로지스틱 회귀분석

glm( )

728x90