728x90

😀 Language 55

[pydicom] DICOM 대량 데이터 PACS프로그램에서 확인하기 (FileSet)

👓 들어가기 전 연구 프로젝트를 하다보면 의료원으로부터 대량의 dicom 파일을 전달받을 것이다. 여러 상하위의 폴더 속 파일들이 많은데, PACS 프로그램에서 영상을 확인하기 위해선 path가 저장된 DICOMDIR 파일이 꼭 필요하다. 그렇다보니 pydicom 패키지 속 fileset 클래스의 Fileset 모듈을 사용한다면 된다! 1. os.walk를 통해 상하위 폴더 내 dcm 파일리스트를 확인하고 2. 반복문을 돌려 Fileset에 add를 할 계획임 3. 단, 오류발생을 대비하여 try ~ except 구문을 사용하면서, 그 오류발생 path들만 따로 모아서 txt 파일로 저장시킴 👓 os.walk & os.path.join 데이터 Path 확인하기 dicom 파일셋을 representatio..

[pydicom]Python으로 PACS DICOM 의료 영상 데이터 활용하기

🐍 Pydicom 소개 의료 영상데이터 관련 업무를 한다면, DICOM 형식의 파일을 필연적으로 마주친다. 파이썬을 통한 DICOM을 다룰 때 Pydicom 패키지는 아주 유용한 패키지가 될 것이다. pydicom 패키지를 활용할 때 기본적인 작업들을 소개하려한다. * pydicom 공식문서: https://pydicom.github.io/pydicom/stable/ 🐍 Pydicom 설치 #pip 사용하여 설치방법 pip install pydicom #conda 사용하여 설치방법 conda install -c conda-forge pydicom 🐍 Dicom 데이터 가져오기 예시 데이터가져오기 의료데이터 정보보호에 의해 쉽게 데이터셋을 구할 수 없다면? 걱정말고 pydicom에서 제공하는 예시 데이터셋..

대용량 csv 파일 pyarrow로 pandas 다루기 & excel 저장 (feat. 연구 데이터)

대용량 csv 파일 pyarrow로 pandas 전처리 &excel 저장 (feat. 연구 데이터) 의료데이터를 활용한 연구를 하게 되면, 시시각각 변하는 환자들의 상태들을 체크하고 AI 분석을 위해서는 tracking 시계열정보를 활용하게 된다. 그렇다보니, 그 tracking term 기준이 몇 초냐 몇 분이냐에 따라 데이터 용량이 천차만별이겠지만 그래도 대용량 데이터가 수집되었다는 사실은 변하지 않는다. 데이터 마이닝이 나의 main job은 아니지만, tracking time series data를 가명화 처리하는 과정으로 인해 대용량 data에 대해 접하게 되었다. 🍎 문제 상황 문제상황 1_ 가명화 처리를 위해서는 의료원의 가명화 프로그램을 활용해야하는데, 파일 업로드 상황에서는 excel 확..

[MySQL] sakila 샘플 DB로 SQL 연습하기- 3탄

[MySQL] sakila 샘플 DB로 SQL 연습하기 - 3탄 🌹 TABLE - film use sakila; show TABLEs; # film================== #등급별로 그룹 각등급별 영화갯수 출력 SELECT rating, count(*) from film GROUP BY rating; #rating 그룹, 각 등급별 영화갯수, 등급 출력, 각그룹평 평균 렌탈비용 출력 SELECT count(*), rating, avg(rental_rate) from film GROUP BY rating; #rating등급별로 그룹묶어서 각등급별 영화갯수, 등급,각그룹별 평균렌탈비용출력, 평균 렌탈비용높은 순 select count(*), rating, avg(rental_rate) from fi..

😀 Language/- SQL 2022.07.25

[MySQL] sakila 샘플 DB로 SQL 연습하기- 2탄

[MySQL] sakila 샘플 DB로 SQL 연습하기 - 2탄 🌹 TABLE - film use sakila; show TABLEs; # film================== desc film; # 1줄 구조 살펴보기 SELECT * FROM film limit 1; # 영화 등급 종류 select distinct rating from film; #영화 출시년도 종류 SELECT distinct release_year FROM film; 🌹 TABLE - rental # rental===================== select * FROM rental LIMIT 10; #inventory 367번째줄 출력 select * from rental where inventory_id=367; #+조건..

😀 Language/- SQL 2022.07.25

[MySQL] sakila 샘플 DB로 SQL 연습하기- 1탄

[MySQL] sakila 샘플 DB로 SQL 연습하기 - 1탄 🌹 TABLE - actor # 실습 준비하기 show databases; use sakila; show tables; # 맨위 actor 테이블 살펴보기 describe actor; desc actor; # 조회 select * from actor; select * from sakila.actor; select * from actor limit 10; #10줄만 조회 # 정렬 select * from actor order by first_name asc; # 오름차순 select * from actor order by first_name; # 기본값 오름차순 select * from actor order by first_name desc;..

😀 Language/- SQL 2022.07.25

[MySQL] sakila 샘플 DB로 SQL 연습 - 0. 데이터 준비

[MySQL] sakila 샘플 DB로 SQL 연습하기 - 0. 데이터 준비 🌹 DB 살펴보기 샘플 데이터베이스를 제공되는 sakila 의 EER diagram은 요렇게 생겼당... ㅋ 조금 복잡해보이지만, 잊어버린 SQL 문법을 떠올리기 위해 너무 좋은 예제가 아닐 수 없다🤗 sakila 데이터베이스에 대한 설명은 아래pdf를 클릭하면 자세히 알 수 있다. https://downloads.mysql.com/docs/sakila-en.pdf 🌹 데이터 다운받기 1. MySQL 공홈에서 제공하는 example database 페이지로 들어간다. https://dev.mysql.com/doc/index-other.html MySQL :: Other MySQL Documentation Other MySQL D..

😀 Language/- SQL 2022.07.07

[샛길공부] join 문자열 리스트 합치기, 공백 구분 추가하기, (feat. 백준 문제 풀 때 유용하더라)

join 문자열 리스트 합치기, 추가하기 (feat. 백준 문제 풀 때 유용하더라) 백준 문제를 풀던 중, 문자열 list로 join을 해야하는데 막 정수형 리스트를 join을 한다는 이런 난리부르쓰 코드식을 쓰고 있었다.. 뚜둥! 다시 공부할 시점인거다!! 👩‍🔧 '구분자' . join ( 문자열리스트 ) 형식으로 작성하게 된다. ❗ 예시 ❗ 심화 ❗전체 코드식 - 문자열 리스트 합치기, 추가하기¶ '구분자' . join ( 문자열리스트 ) 예시¶ In [1]: a= [ "월", "화", "수", "목", "금", "토", "일"] "".join(a) #다 이어 붙이기 Out[1]: '월화수목금토일' In [2]: b= [ "월", "화", "수", "목", "금", "토", "일"] " ".join(..

[Pandas] EDA 자주 사용하는 코드 모아보기 😆

Pandas EDA 자주 사용하는 코드 모아보기 😆 지금까지 배우고 공부했던 pandas 함수를 정리해볼겸, EDA를 하면서 자주 사용했던 함수를 정리해보려한다. 😉 Basic import pandas as pd : 판다스 임포트 (Series와 DataFrame을 다루려면!) import numpy as np : 넘파이 임포트 -> 주로 np.nan (결측값)을 다루기 위해서 사용 import matplotlib.pyplot as plt : 맷플롯립 임포트 import seaborn as sns : 씨본 임포트 Pandas 자료구조 *df = 데이터 프레임 * df.index : df 인덱스 확인 * df.columns: df 열 확인 * df.values: df 값 확인 * df.shape: df 행..

[Pandas] 판다스 튜토리얼 (Pandas quickstart)공부해보기

판다스 공식홈페이지의 매뉴얼 공부를 해보자! 🐼 혹시나 넘파이 공부를 하고 싶다면!! 2022.02.02 - [😀 Language/- Python] - [numpy] 넘파이 튜토리얼 (NumPy quickstart)공부해보기 In [1]: from IPython.core.display import display, HTML display(HTML("")) #티스토리 업로드 원활하게:-) Pandas (Quickstart Tutorial)¶ 공부한 포스팅: https://laboputer.github.io/machine-learning/2020/04/07/pandas-10minutes/ 1. 기초개념¶ In [2]: # 필요한 모듈 불러오기 import pandas as pd import numpy as n..

728x90