'ADsP 예상문제 3과목 - 1 영상' 공부하기
Q1. 모수적 추론 - F-분포
* F-분포란 : 두 집단의 분산이 같은 지를 검정할 때 사용된다.
* 모평균과 표본평균과의 차이 : z-분포, t-분포
* 모분산과 표본분산과의 차이: F-분포(집단 2개), 카이제곱(x^2)분포(집단 1개)
Q2. 집중화 경향 측정
- 집중 경향치(평균, 중앙값, 최빈값)에서 이상값 및 다른 관측값에 의한 영향에 민감한 것을 '평균'이다.
Q3. 자료의 척도
- 명목척도: 단순히 대상특성 분류 / 확인 모적
- 서열척도: 대소/고저 등 순위만 제공, 양적비교불가 ex)금은동, 상중하
- 등간척도: 순위를 부여하되, 간격동일. 양적비교 가능 ex)기온, 물가지수
----> 기온의 0도와 절대 0점과의 개념은 다르다.
- 비율척도: 절대0점이 존재하여 측정값 사이 비율계산가능
Q4. 연관규칙 측정지표
향상도
++ 지지도/ 신뢰도랑 같이 알아두기!
Q7. 모형평가
- k-fold 교차검증: 주어진 데이터를 가지고 반복적으로 성과를 측정 -> 그 결과를 평균 [ 분류분석모형평가기법]
- 홀드아웃: 원천데이터를 랜덤하게 두 분류로 분리하여 교차검정실시
- bootstrap: 훈련용자료를 반복 재선정하면서 평가를 반복한다.
(cf. 교차검증은 훈련용 자료를 반복 재선정하지 않음!)
Q10. 주성분 분석
scale=TRUE 로 되어있으면 상관행렬을 사용한 것!
Q11. 지니지수
1 - (각 범주별 경우의 수 제곱의 합)
Q12. 데이터 마이닝 기법
- 분류: 기존의 분류,정의된 집합에 배정하는 것
- 추정: 알려지지 않은 결과의 값을 추정하는 것
- 예측: 미래에 대한 것을 예측, 추정하는 것을 제외하면 분류나 추정과 동일한 의미
- 기술: 데이터가 가진 특징 및 의미를 단순하게 설명하는 것
Q13. 신뢰구간
- 관측치의 크기가 커지면 신뢰구간의 길이가 줄어든다(반비례)
- 구간추정: 모수의 참값이 포함되어 있을것이라 추정되는 구간을 결정
Q14. 로지스틱 회귀분석
glm( )
'😆 Big Data > - 데이터' 카테고리의 다른 글
[Power BI] 📊 1. Power BI 살펴보기 (0) | 2022.03.02 |
---|---|
[ADsP] ADsP 예상문제 3과목 - 2 영상 공부하기 (0) | 2022.02.25 |
[ADsP] ADsP 예상문제 3과목 - 4 영상 공부하기 (0) | 2022.02.24 |
[ADsP] ADsP 예상문제 3과목 - 3 영상 공부하기 (0) | 2022.02.24 |
[ADsP] ADsP 예상문제 3과목 - 6 영상 공부하기 (0) | 2022.02.23 |