티스토리

개발 아카이빙

검색하기

의료 LLM의 발전에 대해서

Computer Engineering/AI

의료 LLM의 발전에 대해서

soohey 2024. 7. 16. 17:08

LLM에 대한 자료수집을 하다가 메디컬 분야에서도 LLM이 유의미한 성과를 얻었길래 아카이빙해봅니다 ^^

특정 도메인 분야에 특화된 모델을 만들기위해 해당 지식을 파인튜닝하고 Q&A 챗봇을 만들 수 있는 바탕이 될 것 같습니다 :)

글

: https://m.post.naver.com/viewer/postView.naver?volumeNo=38136901&memberNo=34635212

LLM은

언어 모델의 한 종류
문장 내 단어 시퀀스에 확률을 할당하는 역할
목적 : 가장 자연스러운 단어 순서를 찾음
이전 단어가 주어지면 다음 단어를 예측함

의료분야의 LLM

인간과 유사한 텍스트를 이해하고 생성하는 능력을 발휘
복잡한 의료 작업을 해결하고 환자 치료를 개선
의료 질문-답변(QA) 시스템, 대화 시스템, 텍스트 생성
다양한 의료 응용 분야에서 유망한 기술
전자 건강 기록 (EHR), 의학 문헌, 환자 생성 데이터 급증으로 LLM은 의료 전문가들이 중요한 정보를 추출하고 의사 결정을 내리는데 필수적인 도구임

의료 LLM(Medical LLM)의 성과

1) 폐쇄 의료 LLM (Closed Medical LLM) : Google, Med-PARM 2

폐쇄 모델 (Closed LLM)이란
- 특정 기업이나 기관이 개발, 소유
- 공개 사용 및 수정 불가 (예 : GPT-4)
구글의 Med-PARM 2
- 의학적 질문에 전문적 답변을 생성하거나 대량의 건강 데이터를 정리
- 미국 의사 면허시험 USMLE 성적이 뛰어남 (100점 중 86.5점)
- 의사의 답변보다 높은 퀄리티를 가진다고 평가됨
  - 더 높은 합의 반영, 더 나은 지식 회상, 더 뛰어난 추론 능력을 보여줌
  - 부정확하거나 관련 없는 정보가 적고 해를 끼칠 가능성이 적다고 평가됨

2) 공개의료 LLM

인도스타트업 JIVIAI의 medX_v1
- 허깅페이스에서 평균 91.65점 기록
스위스 연방공과대학교의 메디트론
- 메타의 LLama2 기반 학습

3) 국내의료 특화 LLM

연세대 MAI Lab의 medllama3-v20
- 허깅페이스에서 90.01점 기록
고려대, 임페리얼 칼리지 런던 공동연구, sLLM인 Meerkat-7B
- 미국 의사면허시험에서 74점 통과
국내 모델이어도 한국어 답변을 잘하지 않음. 한국어 데이터셋으로 추가 파인튜닝이 필요
평가를 위한 한국어 med LLM 리더보드나 clinical QA셋 구축 필요

저작자표시