[ifkakao2022] 😮 초거대 AI 기술은 헬스케어에 어떻게 활용될까?
들어가기 전에
" 초거대 AI 기술은
헬스케어에 어떻게 활용될까? "
- 카카오브레인 AI기반 헬스케어 사업 및 연구 담당 zeron님
- 발표 페이지링크 : 🖱 클릭
- 발표 자료: 🖱 클릭
🎀 Part 1. 헬스케어 분야 AI 적용사례
1. 의료영상 seg.
- 헬스케어 주된 task, 서비스로 자리매김함
→ 그 이유: 1) 사람이 보면서 해석이 가능하고, 2) 병변 크기나 형태 등 정략적인 정보를 획득함으로써 치료계획에 도움
- 유넷 기술이 사용됨
- 더 정교한 seg. label을 누가 더 많이 확보하는지 따라서 제품성능 향상의 핵심이 됨
🤔 문제점
1) seg. 그리는 작업은 Dr. 노동집약적 결과물
2) 이전보다 수행동기 감소
3) 지속적 학습 감소
2. 의료영상 활용 classification
- detection AI
- 환자의 추가검사 및 치료계획 수립에 영향
- 문제점 : 모델이 어떤 것을 보고 판단하는 지에 대한 정보가 부족함 (->활용가능성 감소)
3. 생체신호 활용
- 주기적/연속적인 생체신호 활용 (ex. EKG, 애플워치 건강정보)
- 인간의 눈으로 탐지하기 힘든 어려운 패턴 조합을 찾아내어 질환 탐지
🤔 문제점 : EMR 다양한 정보와 mapping하고 cleansing하는 과정이 노동집약적
4. 입원환자 EMR V/S 데이터 활용
- 주기적/연속적 EMR 데이터를 RNN등으로 학습 (ex. 24hr 이내 입원환자의 심정지를 예측)
🤔 문제점
1) EMR data-set cleansing 힘듦
2) 실시간 데이터의 경우 효율적인 활용 어려움
🎀 Part 2. 헬스케어 AI 한계점 및 해결방향
1. 한계점
#반드시필요하지않다 #사용성이떨어진다 #비용효과성떨어진다 #신뢰가가지않는다
📌 labor intesive ▶ not scalable ▶ un-usable & un-reliable
- 기술적 문제에 초점을 이룸
1) 학습된 data에 의존하니, 한정적임. 사람처럼 경험을 쌓으면서 지속적으로 발전이 현실적으로 어려움
2) 특정한 상황에서만 잘 판독하지만, 이외 불안함
(*ex - 경부고속도로에서만 자율주행이 good. 나머진 불안함)
- 신뢰 문제 : 진료는 생명을 다루기때문에 한 번의 잘못으로도 신뢰가 떨어짐. 이는 의료진의 업무효율 감소 야기
🤔 기술적 문제 원인
1) 못 본 data(=학습되지 않은) 많기에
2) 못 본 data를 대량으로 생산하기 어려움. 노동집약적인 일임
3) 비즈니스 모델이 불명확하면 도전하기 쉽지않음
2. 해결 방향
2가지 방법으로 접근 가능함
☝ work-flow 제대로 고려하며 사람중심으로 생각하기
: 현재처럼 반복적인 레이블링 작업을 줄이고, work-flow내에서 자연스럽게 data가 생성되도록
✌ 대량의 multi-modal 데이터를 인간처럼 학습할 수 있는 초거대 AI 활용하기
: 연관성있는 데이터끼리 결합하여 학습시켜 학습효율을 극대화시킨다.
(→ 노동집약적 레이블 의존도가 떨어짐)
이로써,
기존에 익숙한 work-flow 내에서 data가 자연스럽게 생성되면, 이를 활용하여 AI 모델을 지속발전시킬 수 있는 데이터 선순환이 가능 해짐(scalable). 이는 인간처럼 종합적으로 사고하고 실제 환경처럼 일반적으로 행동할 가능성이 높이지게 됨(usable&reliable)
- 초대량의 데이터셋 처리는 적은 레이블로도 좋은 성능을 보이는 초거대 AI기술을 활용
(초거대 AI 모델은 Ko-GPT(GPT3), Karlo(DALL-E), ALIGN(Align) 등 있음)
→ 데이터 선순환과 초거대AI 기술은 혁신을 위한 단짝임
🎀 Part 3. 헬스케어 초거대 AI 활용방향
* 이와 관련하여 카카오에서 고민 중인 연구과제 3가지
1. Multi - modal
- 연관성 있어보이는 다양한 헬스케어 데이터들을 최대한 활용해보고자 함
: 의료영상/의료서적/판독문/검사결과/임상기록지/개인생성 건강데이터 등 초대량의 데이터
- 인간처럼 복합적으로 사고하는 초거대 AI 활용
: 의료진에게 실제 도움이 되는 효용성
2. User - centric measurement
- 고객의 미충족 수요와 연관된 새로운 사용자 기반의 metric을 개발하는 것
: health-care 분야의 경우 현재 고객의 needs를 제대로 반영한 metric이 부족하다고 생각됨
3. Large - scale AI engineering
- health-care의 noisy한 초대량규모 data들로 선순환을 위해서는 user-centric metric 기반으로 automatic preprocessing 시스템이 잘 갖춰져야 함
- 주기적인 input data를 automatic cleansing하는 기술은 해당분야에서 기술격차를 벌리는데 큰 도움이 됨
- 깊은 도메인 지식과 고객 이해도가 뒷받침 되어야 함- 기업 입장 : 영역 이익률 극대화를 위해, 자연 효율화 시스템 기술력 확보는 당연히 필요함
🎀 Part 4. 앞으로 카카오에서의 활용방안
1. Multi - modal
- CXR cad S/W 상용화를 위해 노력함
: 고객이 가장 필요로하는 초안판독문 생성문제에 접근하고자 함
: seg. & classification 집중의 노동집약적인 기존과는 차별
: 이미지 to 텍스트 접근 시 multi-modal 데이터셋에서 필요한 정보들을 추출하여 접근
2. User - centric measurement
- 의료영상 판독문 생성을 사용자 관점에서 평가할 수 있는 metric 개발 노력함
: 생성된 텍스트의 유의미성을 평가하기 위한 다양한 metric이 기존이 있긴하지만, 의료진의 needs를 반영했다고 보기 어려움.
(기존 metric : BLEU 스코어, Perplexity 스코어, CIDEr, ROUGE-I, SPICE)
3. Large - scale AI engineering
- 초대량거대규모의 data-set의 좋은 data-set & 효율적인 proprocessing ---> COYO dataset 참고
마치면서
이 session 발표는 최근 헬스케어 AI 연구원으로서 하고 있는 고민을
해소시켜주는 발표였다.
일단 문제를 해결함에 있어
현재 상황, 문제점 진단, 문제점에 따른 해결방안이라는 단계에 걸쳐
나름 명쾌한 접근이었기에- !
덧붙여 현재 카카오에서 노력하고 있는 것과 연관 결과물까지 어필했으니
훌륭한 발표였다고 생각한다.
다른 훌륭한 발표도 확인해봐야지😎
'🤓 Health care Study > - IT 연구간호사' 카테고리의 다른 글
[IT용어] 👩🔧근무하면서 정리하는 IT 연구간호사 사용 용어 (+08.23 업로드) (0) | 2022.08.23 |
---|---|
[IRB] 연구간호사 준비기 - 심사위원회 위원(IRB) 신규자 과정(의사외)(KoNECT) (0) | 2022.06.10 |
[GCP] 연구간호사 준비기 - 2022년 GCP 신규자 과정 (KONECT) (0) | 2022.05.23 |