728x90

전체 글 373

[ADsP] ADsP 예상문제 3과목 - 3 영상 공부하기

'ADsP 예상문제 3과목 - 3 영상' 공부하기 Q2. / Q3. 연관규칙 측정지표 - 신뢰도 빵-> 우유에 대한 신뢰도 : 빵+우유 거래수 / 빵 거래수 - 향상도 빵-> 유유에 대한 향상도 : 빵+우유 거래수 / (빵 거래수 * 우유 거래수) Q9. 확률적 표본 추출방법 - 단순무작위 추출: 모집단 개체가 표본으로 선택될 확률이 동일하게 추출 - 계통 추출: 일련번호를 부여한 후, 첫번째 표본 + 일정간격 (k) ex) 1/11/21/31/41/51... - 층화 추출: 모집단을 서로 겹치지 않게 몇개 집단 또는 층으로 나누고, 각 집단 내에서 원하는 크기 단수 무작위추출 - 군집 추출 Q14. 로지스틱 회귀모형 - 종속변수가 범주형인 경우 사용 - 모형탐색 방법으로 최대우도법(MLE)을 사용 - ..

[ADsP] ADsP 예상문제 3과목 - 6 영상 공부하기

'ADsP 예상문제 3과목 - 6 영상' 공부하기 Q16. 시계열 데이터 - 지수평활법 - 전체 시계열자료를 이용하여 평균을 구하고, 최근시계열에 더 큰 가중치를 적용하는 방법 - 지수 평활을 사용하여 얻은 예측값 -> 과거 관측값의 가중평균 - 과거관측값은 오래될수록 지수적으로 감소하는 가중치를 갖음 Q17. 모수적 추론 - T-test - 동일 개체에 어떤 처리를 하기 전후의 자료를 얻을 때, 차이 값에 대한 평균 검정을 위한 방법 - 가능한 동일 특성을 갖는 두 개체에 대해 서로 다른 처리를 하여 그 처리효과를 비교하는 방법 - ex) 같은 환자대상 약물 섭취 전후 변화 평균 조사 - 서로 다른 두 그룹의 평균을 비교하여 두 표본 차이가 있는지 검정하는 방법 Q18. 의사결정나무의 분리기준 - 분리..

[ADsP] ADsP 예상문제 3과목 - 5 영상 공부하기

'ADsP 예상문제 3과목 - 5 영상' 공부하기 Q1. 지니지수 - 불순도 측정을 위해 = 1 - 각 경우의 수의 제곱 합 Q2. 연관규칙 딸기->사과 지지도 * 연관규칙- 지지도: P(AUB) / N => 딸기,사과 구입한 거래건수 /전체 거래건수 +++ 더 추가해서 공부하기! *연관규칙 - 향상도 *연관규칙 - 신뢰도 Q3. 확률분포 - 확률변수에서 기댓값 : x*f(x)들을 다 다해줌 Q4. F1값구하기 precision : 진짜라고 예측 중에 -> 실제 진짜 recall(재현율) = 민감도(sensitivity) : 실제 진짜 중에 -> 진짜라고 예측 F1 = 2* (precision * recall/ precision +recall) Q7. Cluster - 계층적 군집 * 와드 연결법 : 군..

[데이터 사이트] ✨공공데이터 이외 데이터 찾는 방법 (추천사이트)

🙃 찾게된 이유 '공공'이란 이름이 붙어서 인지 좀더 개인적인 정보들이 부족해서, 데이터 분석하기에 실제감이 확 와닿지 않았다. 최근 들어서야, 데이터의 가명 처리에 대해 많은 논의가 되고 이에따라 데이터 변환 및 제공이 되고 있기에 공공데이터 말고 다른 곳에서 데이터를 찾아보려는 노력을 하였다! ----> 그 결과 보물과도 같은 사이트 몇개를 찾았다! 💎 🌞 1. 일단 ' 공공데이터 ' 사이트 List >> 바로 '공공 데이터' 이외 사이트 내용으로 JUMP 하려면 왼쪽 목차 '2번' 클릭🖱 > 흔히 아래와 같은 공공 사이트는 많이 알고 있을 것이다... > 그래도 모르는 사람들도 있을 수 있으니 공유 👇👇 * 공공데이터포털 www.data.go.kr 공공데이터 포털 국가에서 보유하고 있는 다양한 데이..

[Pandas] Pandas 연습 문제 풀기 -6 🐼

Pandas 연습 문제 풀기 -6 🐼 필요한 라이브러리 임포트¶ In [1]: import pandas as pd import numpy as np [데이터] 확인¶ user_id 유저 아이디 age 나이 gender 성별 occupation 직업 zip_code 우편번호 파일 불러오기¶ read_csv를 통해 './data/users.csv'파일을 올바른 형태로 불러온 뒤 users에 저장해주세요. user_id를 인덱스로 설정해주세요. 열을 구분하는 구분자는 '|'임 In [2]: users = pd.read_csv("./data/users.csv", sep="|", index_col="user_id") users Out[2]: age gender occupation zip_code user_id 1..

[Pandas] Pandas 연습 문제 풀기 -5 🐼

Pandas 연습 문제 풀기 -5 🐼 필요한 라이브러리 임포트¶ In [1]: import pandas as pd import numpy as np 데이터 불러오기¶ read_csv를 통해 './data/drinks.csv'파일을 올바른 형태로 불러온 뒤 drinks 저장해주세요 In [2]: drinks = pd.read_csv('./data/drinks.csv') drinks Out[2]: country beer_servings spirit_servings wine_servings total_litres_of_pure_alcohol continent 0 Afghanistan 0 0 0 0.0 AS 1 Albania 89 132 54 4.9 EU 2 Algeria 25 0 14 0.7 AF 3 Ando..

[Pandas] 판다스 튜토리얼 (Pandas quickstart)공부해보기

판다스 공식홈페이지의 매뉴얼 공부를 해보자! 🐼 혹시나 넘파이 공부를 하고 싶다면!! 2022.02.02 - [😀 Language/- Python] - [numpy] 넘파이 튜토리얼 (NumPy quickstart)공부해보기 In [1]: from IPython.core.display import display, HTML display(HTML("")) #티스토리 업로드 원활하게:-) Pandas (Quickstart Tutorial)¶ 공부한 포스팅: https://laboputer.github.io/machine-learning/2020/04/07/pandas-10minutes/ 1. 기초개념¶ In [2]: # 필요한 모듈 불러오기 import pandas as pd import numpy as n..

[Pandas] Pandas 연습 문제 풀기 -4 🐼

데이터 EDA를 위한 Pandas 역량기르기 타~임! 맛집 데이터를 정돈하기¶ In [1]: # 라이브러리 임포트 하기 import pandas as pd import matplotlib.pyplot as plt import os In [2]: os.listdir('./data') Out[2]: ['.ipynb_checkpoints', 'auto-mpg.csv', 'euro12.csv', 'Euro_2012_stats_TEAM.csv', 'matzipData.csv', '남북한발전전력량.xlsx', '소상공인시장진흥공단_상가업소정보_의료기관.csv', '주가데이터.xlsx'] In [3]: # './data/matzipData.csv'을 읽어서 df에 대입하기, 단 인코딩은 utf-8 df = pd.re..

[Pandas] Pandas 연습 문제 풀기 -3 🐼

데이터 EDA를 위한 Pandas 역량기르기 타~임! 필요한 라이브러리 임포트¶ In [2]: import pandas as pd import numpy as np import os In [3]: os.getcwd() Out[3]: 'C:\\sona\\KDT\\pandas\\Day_2' In [4]: os.listdir() Out[4]: ['.ipynb_checkpoints', 'auto-mpg.csv', 'Euro_2012_stats_TEAM.csv', 'Example-01.ipynb', 'matzipData.csv', 'Pandas-05.ipynb', 'Pandas-06.ipynb', '남북한발전전력량.xlsx', '소상공인시장진흥공단_상가업소정보_의료기관.csv', '연습03.ipynb', '연습0..

[Pandas] Pandas 연습 문제 풀기 - 2 🐼

데이터 EDA를 위한 Pandas 역량기르기 타~임! * 문제풀이 깃허브: https://github.com/LIMSONA/KDT/blob/main/pandas/Day_1/%EC%97%B0%EC%8A%B502.ipynb Step 1. 필요한 라이브러리 임포트¶ In [1]: import pandas as pd import numpy as np Step 2. 데이터 확인¶ 이번 데이터는 dictionary 형태로 주어져 있습니다 regiment 연대 company 군대 In [2]: # Create an example dataframe about a fictional army raw_data = {'regiment': ['Nighthawks', 'Nighthawks', 'Nighthawks', 'Night..

728x90