728x90
🤸 머신러닝 데이터의 유형 🤸
1. 데이터 수집과 정의
- 각자 모형화를 진행하기 위해 데이터를 수집하는 부분을 담당한다고 가정
Q. 해당분석의 도메인에 대해 조사하고 분석의 중요성(또는 목표)에 대해 설명해 보시오
Q. 분석에 필요한 데이터를 어떻게 정의하면 좋을지 조사하시오
Q. 어떤 데이터가 수집될 수 있는지 예시를 작성하시오
2. 데이터 분류
1) 데이터 가공 정도별
① 1차 자료: 원시자료 - 측정 데이터, 조사 데이터
② 2차 자료: 가공자료 - 국가통계, 집계 데이터, 전망정보
2) 데이터 유형별
① 정형 자료: 유형을 정의하여 분석에 활용가능 (수치형, 문자형)
② 비정형 자료: 정형화를 위한 별도의 가공이나 기준이 필요한자료들 (기록, 일지 등)
3) 데이터 표시 형식별
① 연속형(continuous) 자료: 연속적인 수치 (주가지수, 경제 성장률, 맥박 등)
② 이산형(discrete) 자료: 연속적이지 않은 수치 (연령구분, 평점 등)
4) 데이터 척도 종류
① 질적
- 명목척도: 서로 다른 것으로만 정의 ( 성별 등 )
- 순서(서열)척도: 순서에 의미가 있게 정의 ( 금은동, 평점 등)
② 양적
- 간격(구간)척도: 연속형 자료로 수치 구간화로 간격에 의미가 있게 정의 ( 시각, 연령 등)
- 비율척도: 연속형 자료 자체 또는 비율적으로 의미가 있게 정의 ( 매출액, 종사자 수 등)
728x90
'😆 Big Data > - ML & DL' 카테고리의 다른 글
[ML] 🤸 4. 머신러닝 알고리즘 평가 (0) | 2022.03.01 |
---|---|
[ML] 🤸 3. 머신러닝 알고리즘 (0) | 2022.03.01 |
[ML] 🤸 1. 머신러닝의 개요 (0) | 2022.03.01 |
[ML 알고리즘] 이상 탐지(Anomaly Detection) 알고리즘 (0) | 2022.02.06 |
[딥러닝] tensorflow로 자동차 연비예측하기 (텐서플로우. 회귀) (0) | 2021.12.29 |