AI가 인간 의사를 이겼다!! 정말로??

in #kr6 years ago (edited)

오랜만입니다. @parkhs입니다.

지난 글에서는 AI 이미지판독의 의료도입에 대해서 부정적으로 적은 듯 한데요.

사실 AI는 의료이미지를 인식해서 종양을 찾거나 암세포를 찾아내는 등의 단일 작업에서 이미 인간전문가와 동등하거나 그 이상의 성능을 보여주고 있습니다. 성능자체가 떨어지는 것은 아닙니다.

AI를 이용한 판독시스템의 특징을 잘 드러내는 연구결과가 있습니다. 'Detecting Cancer Metastases on Gigapixel Pathology Images'입니다. AI를 이용해서 암세포의 림프절 전이를 찾아내는 내용인데 결과가 얼핏보면 충격적입니다. AI가 92.4%의 암세포를 찾아낸 반면, 인간은 73.2%의 암세포만을 찾아내었습니다. 인간전문가들을 압도하는 성적입니다.

그래서 다음과 같은 제목의 기사가 나기도 했습니다.

'Google AI Just Beat Human Pathologists at Detecting Cancer'

그런데 고작 73%?? 병원에서 검사했는데 환자 10명중 3명에서 암을 놓치면 매우 큰일입니다. 하지만 이 수치는 실험조건을 자세히 들여다보면 그럴만 합니다. 조직슬라이드를 스캔했을때 그 크기는 10만 X 10만 픽셀에 달합니다. 그 거대한 이미지에서 암세포를 하나하나 모두 골라내어야 100%인 것이지요.

실제로는 슬라이드에서 (림프절에) 암세포덩어리를 하나 찾아냈다면 그 근처의 한 두 개의 암세포, 그것도 암세포인지 아닌지 애매한 것들까지 암세포로 표시하기 위해 시간을 들일 필요는 없습니다. 이미 (해당 림프절의) 전이가 확인되었으니까요. 이 연구에서는 AI의 성능을 비교하기 위해서 실제 현장에서는 적용하기 어려운 기준을 사용한 것입니다.

이 연구에 참여한 인간전문가들도 마찬가지 였을 겁니다. 확실한 암세포덩어리를 발견한 슬라이드에서는 상대적으로 애매한 것들, 특히 한 두개 씩 흩어져 있는 것들까지 집중해서 시간을 들여서 고민하지 않았을 겁니다. 게다가 실제 상황도 아니고 연구용 상황에 많은 시간을 들이기에는 너무 바쁜 사람들이니까요...

구글_up.png

확실한 암세포가 발견되지 않은 슬라이드에서 애매한 세포 한 두개는 상당한 고민을 하게 만듭니다. 그래도 슬라이드 한 장만을 몇 시간씩 들여다 볼 수는 없는 노릇입니다. 봐야할 다른 슬라이드도 많이 있기 때문이지요. 이렇다보니 환자에게는 좋은 일이지만 아무리 찾아봐도 암세포가 나오지 않는 경우는 불안합니다. 혹시나 놓친게 있을까봐요.

여기서 AI의 장점이 드러납니다. AI는 지치지도 않고 매우 많은 양의 픽셀을 매우 빠른 속도로 하나하나 들여다 볼 수있습니다. 그러다보니 인간전문가보다 더 민감하게 발견할 수 있는 것이지요.

그러나 이러한 높은 민감도(실제 암세포를 암세포라고 판독)는 특이도(실제 암세포가 아닌 것을 암세포가 아니라고 판독)를 어느 정도 희생하고 얻어낸 것입니다. 조금만 이상한 세포도 암세포로 판독하면 암세포를 100% 넘게 찾아낼 수 있습니다. 그 중에 수많은 암세포가 아닌 정상세포도 암세포로 판독이 되었을 테지만 말입니다.
이 연구에서도 슬라이드 하나당 8개 까지 암세포가 아닌 것을 암세포라고 판단하는(False Positive) 정도를 용인하는 수준의 판단기준을 적용해서 얻어졌습니다.

그런데 만약 실제 병원에서 AI가 모든 판단을 내린다면 어떨까요? AI가 암세포가 아닌 것을 암세포로 판단했고 그것 때문에 문제가 생겼다면 책임은 누가 져야 할까요? 완벽한 AI를 만들 수 있을까요? False Positive를 없애기 위해서 판단 기준을 대폭 올린다면 암세포인 것을 아니라고 하는 경우도 발생할 것입니다. 그 경우는 더 큰 문제가 되지요.

이러한 점을 이용해서 민감도가 높은 AI를 이용해서 인간이 판독하기 전에 비정상인것 같은 부분을 먼저 골라주는 스크리닝 작업을 하고 인간 의사가 최종 확인하거나 최종 판단을 내리는 것이 현재로는 가장 이상적인 방법일 것 입니다.

Sort:  

Cheer Up!

  • from Clean STEEM activity supporter

Congratulations @parkhs! You have completed some achievement on Steemit and have been rewarded with new badge(s) :

Award for the number of upvotes received

Click on any badge to view your own Board of Honor on SteemitBoard.
For more information about SteemitBoard, click here

If you no longer want to receive notifications, reply to this comment with the word STOP

By upvoting this notification, you can help all Steemit users. Learn how here!

Congratulations @parkhs, this post is the sixth most rewarded post (based on pending payouts) in the last 12 hours written by a Newbie account holder (accounts that hold between 0.01 and 0.1 Mega Vests). The total number of posts by newbie account holders during this period was 2450 and the total pending payments to posts in this category was $1112.85. To see the full list of highest paid posts across all accounts categories, click here.

If you do not wish to receive these messages in future, please reply stop to this comment.

컴퓨터비전분야는 정말 대단한것 같습니다 암진단에도 사용이 가능하군요ㅎㅎ
잘 읽고 갑니다!!

요 몇년간 기술이 획기적으로 발전하고 있는것 같습니다.ㅎㅎ 이미 사람보다 뛰어난 성능을 보이는 시점에서 사람이 답을 달아준 데이터로 학습하는 supervised learning은 올라갈 수 있는데까지 올라왔다고 생각합니다. 앞으로 어떻게 될지가 더 흥미진진합니다.

정말 대단합니다 ㅎㅎ 시술 단계는 부족한 점이 있을지 몰라도 진단에 한해서는 정말 AI가 월등해질 수도 있다 생각해봅니다

AI는 정말 굉장한 성능의 기술이지요ㅎㅎ 그걸 어떻게 사용하는지가 앞으로 점점 더 중요해질 것 같습니다. 시술분야도 크게 발전하고 있습니다. 모발이식 같은 경우는 로봇에 적용되어 시술을 도와주는 형태로 상용화되어서 한국에 도입되기도 했습니다.

AI는 인간의 훌륭한 조수 역할로 남아야 이상적일 것 같습니다. 인간과 AI의 조화로운 모습을 기대해봅니다.

좋은 글 감사합니다. AI 주제에서 항상 화두는 "그럼 책임은 누가 지나" 인 것 같습니다. 기술의 발전 과정을 예의주시 해야겠습니다. ^^

생각해보면 지금 병리학적 진단 기준이 어느정도 사람이 놓칠 수도 있는 false-positive, false-negative 를 고려해서 만들어진 것 일텐데, 이 진단기준에 AI를 갖다 붙여서 비교하는 것 자체가 무의미한 것일 지도...그나저나 몇년 뒤면 병리학 책이 새로 쓰여질지도 모르겠네 ㅎ

아마도 진단기준들이 좀 더 자세해지고 세분화된 진단도 가능해지겠지요. 앞으로 많은 좋은 연구결과들이 쏟아져 나오길 희망합니다.ㅎㅎ

좋은 글 잘 읽었습니다.

흥미있게 잘 읽었습니다.

Coin Marketplace

STEEM 0.28
TRX 0.11
JST 0.034
BTC 66518.22
ETH 3187.49
USDT 1.00
SBD 4.05