😲 의료인공지능 데이터분석
의료 인공지능 데이터 분석 기본과정 - 2. Numpy,Pandas기초
또방91
2022. 7. 19. 10:46
728x90
의료 인공지능 데이터 분석 기본과정
- 2. Numpy, Pandas 기초
🍎 수업 목록
의외로 제일 약한 Numpy.....
거의 Pandas만 사용하기에 이번 기회에 numpy에 대해 되짚어보고
pandas 내에서도 remind가 필요한 pivot에 대해서도 되짚어보자
🍎 수업 내용 요약
https://github.com/LIMSONA/Medical_AI_Data_Analysis_Basic_Course/blob/main/numpy_pandas/README.md
GitHub - LIMSONA/Medical_AI_Data_Analysis_Basic_Course: 의료 인공지능 데이터 분석 기본과정 연습
의료 인공지능 데이터 분석 기본과정 연습. Contribute to LIMSONA/Medical_AI_Data_Analysis_Basic_Course development by creating an account on GitHub.
github.com
🍎NumPy_Pandas_Matplotlib
01_Numpy
numpy library에서 자주 사용되는 함수y
np.array - 배열생성
np.zeros - 0이 들어있는 배열 생성
np.ones - 1이 들어있는 배열 생성
np.empty - 초기화가 없는 값으로 배열을 반환
np.arange(시작,끝미만,간격) - 배열 버전의 range 함수
np.linspace(시작,끝이하,갯수) - 갯수만큼 시작과 끝의 일정한 간격 배열생성
np.random - 다양한 난수가 들어있는 배열 생성
array 속성 값 관련 함수
arr.ndim - 배열 차원 확인
arr.shape - 행,열 확인
arr.size - 행*열 값 확인
arr.dtype - 배열데이터 타입 확인
array 조작 함수
arr.reshape(열,행) - 열,행 shape 변경
np.concatenate - array 이어붙임
np.split - array 분할
집계함수
np.sum - 합계
np.min - 최소
np.max - 최대
np.mean - 평균
02_Pandas
pandas library에서 자주 사용되는 함수
pd.series - 시리즈 데이터 생성
pd.DataFrame - 데이터 프레임 생성
pd.map -
pd.apply - 함수로 데이터 처리하기
dataframe
df.index - 인덱스 확인
df.columns - 열 확인
df.to_csv - csv파일 저장
df.to_excel - xls / xlsx파일 저장
df.read_csv - csv파일 열기
df.read_excel - xls / xlsx파일 열기
df indexing/slicing 함수
df.loc - 명시적인 인덱스 참조
df.iloc - 파이썬 스타일 정수 인덱스 참조
df 함수
df.isnull() - null값? T/F
df.notnll() - not null값? T/F
df.dropna() - null값 삭제
df.fillna() - null값 채움
df.sort_values() - 값으로 정렬하기
03_Pandas_advanced_stage
df.query - 조건으로 검색
그룹
df.groupby - 그룹으로 묶기
df.groupby(조건).sum - 그룹 기준 합계
df.groupby(조건).aggregate - 여러 집계를 한번에 계산
df.groupby(조건).mean - 그룹 기준 평균
df.groupby(조건).aggregate - 그룹 기준 필터링
df.groupby(조건).get_group - 그룹 안에서 key값으로 데이터 조회
피벗
pd.pivot_table(df,index= , columns= , values= , aggfunc= )
04_Matplotlib
plot 기본
plt.plot
plt.title - 제목
plt.xlable - x축 제목
plt.ylable - y축 제목
fig, ax
fig,ax=plt.subplots() - 그래프 1개
ax.plot
ax.set_title - 제목
ax.set_xlabel - x축 제목
ax.set_ylabel - y축 제목
ax.set_xlim - x축 최소,최대
ax.set_ylim - y축 최소,최대
fig.set_dip - 그래프그림 크기
fig.savefig - 그래프그림 저장
(ex. 2*1 그래프 그리기)
fig,axes=plt.subplots(2,1)
axes[0].plot(~~)
axes[1].plot(~~)
lineplot
ax.plot(x,y,
linestyle= 라인 표시 종류 - -- -. :
marker= 마커 표시 종류 . o v s *
color= 라인 색 r green 0.8 #524FA1)
legend
ax.legend(loc= 위치 upper right / upper left / ~~~ / best
shadow= 그림자 True / False
fancybox= 둥근네모 박스모양 True / False
boarderpad= 안쪽 여백
facecolor= 박스배경색)
05_데이터 분석이란
주제 선정 > 데이터 구조 파악 > 데이터 전처리 > 데이터 분석
🍎 한줄평
테스트에서 2문제를... 틀렸다고 하는데, 답을 확인할 수 없어 참 답답쓰..ㅠ
728x90