728x90

😀 Language/- Python 37

[pydicom] DICOM 대량 데이터 PACS프로그램에서 확인하기 (FileSet)

👓 들어가기 전 연구 프로젝트를 하다보면 의료원으로부터 대량의 dicom 파일을 전달받을 것이다. 여러 상하위의 폴더 속 파일들이 많은데, PACS 프로그램에서 영상을 확인하기 위해선 path가 저장된 DICOMDIR 파일이 꼭 필요하다. 그렇다보니 pydicom 패키지 속 fileset 클래스의 Fileset 모듈을 사용한다면 된다! 1. os.walk를 통해 상하위 폴더 내 dcm 파일리스트를 확인하고 2. 반복문을 돌려 Fileset에 add를 할 계획임 3. 단, 오류발생을 대비하여 try ~ except 구문을 사용하면서, 그 오류발생 path들만 따로 모아서 txt 파일로 저장시킴 👓 os.walk & os.path.join 데이터 Path 확인하기 dicom 파일셋을 representatio..

[pydicom]Python으로 PACS DICOM 의료 영상 데이터 활용하기

🐍 Pydicom 소개 의료 영상데이터 관련 업무를 한다면, DICOM 형식의 파일을 필연적으로 마주친다. 파이썬을 통한 DICOM을 다룰 때 Pydicom 패키지는 아주 유용한 패키지가 될 것이다. pydicom 패키지를 활용할 때 기본적인 작업들을 소개하려한다. * pydicom 공식문서: https://pydicom.github.io/pydicom/stable/ 🐍 Pydicom 설치 #pip 사용하여 설치방법 pip install pydicom #conda 사용하여 설치방법 conda install -c conda-forge pydicom 🐍 Dicom 데이터 가져오기 예시 데이터가져오기 의료데이터 정보보호에 의해 쉽게 데이터셋을 구할 수 없다면? 걱정말고 pydicom에서 제공하는 예시 데이터셋..

대용량 csv 파일 pyarrow로 pandas 다루기 & excel 저장 (feat. 연구 데이터)

대용량 csv 파일 pyarrow로 pandas 전처리 &excel 저장 (feat. 연구 데이터) 의료데이터를 활용한 연구를 하게 되면, 시시각각 변하는 환자들의 상태들을 체크하고 AI 분석을 위해서는 tracking 시계열정보를 활용하게 된다. 그렇다보니, 그 tracking term 기준이 몇 초냐 몇 분이냐에 따라 데이터 용량이 천차만별이겠지만 그래도 대용량 데이터가 수집되었다는 사실은 변하지 않는다. 데이터 마이닝이 나의 main job은 아니지만, tracking time series data를 가명화 처리하는 과정으로 인해 대용량 data에 대해 접하게 되었다. 🍎 문제 상황 문제상황 1_ 가명화 처리를 위해서는 의료원의 가명화 프로그램을 활용해야하는데, 파일 업로드 상황에서는 excel 확..

[샛길공부] join 문자열 리스트 합치기, 공백 구분 추가하기, (feat. 백준 문제 풀 때 유용하더라)

join 문자열 리스트 합치기, 추가하기 (feat. 백준 문제 풀 때 유용하더라) 백준 문제를 풀던 중, 문자열 list로 join을 해야하는데 막 정수형 리스트를 join을 한다는 이런 난리부르쓰 코드식을 쓰고 있었다.. 뚜둥! 다시 공부할 시점인거다!! 👩‍🔧 '구분자' . join ( 문자열리스트 ) 형식으로 작성하게 된다. ❗ 예시 ❗ 심화 ❗전체 코드식 - 문자열 리스트 합치기, 추가하기¶ '구분자' . join ( 문자열리스트 ) 예시¶ In [1]: a= [ "월", "화", "수", "목", "금", "토", "일"] "".join(a) #다 이어 붙이기 Out[1]: '월화수목금토일' In [2]: b= [ "월", "화", "수", "목", "금", "토", "일"] " ".join(..

[Pandas] EDA 자주 사용하는 코드 모아보기 😆

Pandas EDA 자주 사용하는 코드 모아보기 😆 지금까지 배우고 공부했던 pandas 함수를 정리해볼겸, EDA를 하면서 자주 사용했던 함수를 정리해보려한다. 😉 Basic import pandas as pd : 판다스 임포트 (Series와 DataFrame을 다루려면!) import numpy as np : 넘파이 임포트 -> 주로 np.nan (결측값)을 다루기 위해서 사용 import matplotlib.pyplot as plt : 맷플롯립 임포트 import seaborn as sns : 씨본 임포트 Pandas 자료구조 *df = 데이터 프레임 * df.index : df 인덱스 확인 * df.columns: df 열 확인 * df.values: df 값 확인 * df.shape: df 행..

[Pandas] 판다스 튜토리얼 (Pandas quickstart)공부해보기

판다스 공식홈페이지의 매뉴얼 공부를 해보자! 🐼 혹시나 넘파이 공부를 하고 싶다면!! 2022.02.02 - [😀 Language/- Python] - [numpy] 넘파이 튜토리얼 (NumPy quickstart)공부해보기 In [1]: from IPython.core.display import display, HTML display(HTML("")) #티스토리 업로드 원활하게:-) Pandas (Quickstart Tutorial)¶ 공부한 포스팅: https://laboputer.github.io/machine-learning/2020/04/07/pandas-10minutes/ 1. 기초개념¶ In [2]: # 필요한 모듈 불러오기 import pandas as pd import numpy as n..

[numpy] 넘파이 튜토리얼 (NumPy quickstart)공부해보기

🐼 혹시나 판다스 공부로 넘어가고 싶다면?? 2022.02.22 - [😀 Language/- Python] - [Pandas] 판다스 튜토리얼 (Pandas quickstart)공부해보기 In [1]: from IPython.core.display import display, HTML display(HTML("")) #티스토리 업로드 원활하게:-) Numpy (Quickstart Tutorial)¶ 공부한 포스팅: https://laboputer.github.io/machine-learning/2020/04/25/numpy-quickstart/#item3 1. 기초 개념¶ In [2]: import numpy as np 1) example¶ In [3]: # (3, 5) 크기의 2D 배열 a= np.ar..

[파이썬] 주사위 30개를 10000번 던졌을 때 정규분포표 그리기 (+중심극한)

🎲주사위30개를 던졌을 때의 합을 구하는데 , 10000회차의 정규분포표를 그려보자! 복잡한 넘파이 랜덤 필요없다. 그냥 random 모듈로 쓰면 된다. 쨔---안! 가운데 볼록 튀어나온 정규분포표가 그려졌다!😉 아래의 사진은 주사위의 숫자가 나올 확률의 분표를 그린 경우여서 위에서 작성한 주사위 합과는 살짝 다르지만, 암튼 이 그림을 첨부한 이유는 이렇다.. 데이터 수가 많아질수록 정규분포표의 그래프와 비슷해져간다는 걸 알려주고 싶었다 🙂 '중심극한정리'라는 개념인데 충분히 많은 수의 상호독립적인 확률 변수들의 합 또는 평균의 표본분포가 근사적으로 정규분포를 따른다는 개념이다.

[샛길공부] int( )함수 자세히 알아보기! int(값,진수) (그의 매력을 파헤쳐보자)

으~~응????? int( )함수로 진수를 설정할수 있었따고라고라고라??????? int ( ) 함수 * int()함수는 파이썬의 내장함수로 들어있고, 보통 정수로 받고 싶을 때 사용한다. * 그런데 그의 매력을 사용하지 못하고 있었으니~ 바로! 받아들일때 몇 진수의 값으로 받아들일지 정할 수 있다는 거다.🙂 int (x,base=10) ===> 즉, int (값, 진수) [ex] 110을 input을 했는데 10진수인 일백십으로 인식한게 아니라, 2진수인 110(2) 육으로 인식 했다. 참고하기 자세한 사항은 파이썬 공식홈페이지에 설명된 아래 페이지 클릭클릭!!! https://docs.python.org/ko/3/library/functions.html#int 내장 함수 — Python 3.10.2 ..

[pymysql 모듈] 파이썬과 mysql 연동시키기!

🤝PYTHON과 MySQL 연결시켜주기! PYTHON과 MySQL을 연결해주는 pymysql 모듈 을 이용하게되면 !!! python에서 sql 쿼리문을 작성하고, sql db 접속 및 테이블 작성이 가능하다! 한번 차근 차근 알아볼까나?? 😄 목차 1. 기본 (튜플형태로 얻기) 2. 딕셔너리 형태로 얻기 3. 연결된 SQL테이블에 데이터 입력하기 ( + connect 과정을 함수 지정하기) 4. 결과 값 개수 정하기 (fetch) 5. SQL 테이블 pandas로 출력해보기 In [1]: from IPython.core.display import display, HTML display(HTML("")) #티스토리 업로드 원활하게:-) Python과 SQL 연동하기¶ 순서 모듈 설치: !pip insta..

728x90