AI의 이미지 감지, 현실세계의 '불확실성'을 어떻게 대처할까?

jenna.pulse9 (48)in #kr-newbie • 8 years ago

이미지 감지 AI를 학습시킬때 '현실세계(Real world)'를 가지고 학습시킬 수는 없기때문에 사진이라던지 컴퓨터가 생성해낸 이미지 혹은 비디오 등을 이용해야 합니다. 하지만 이런 데이터를 통해 AI를 학습시키는덴 한계가 있으며 '현실세계'선 통제되지 않은 요인들이 많기 때문에 이미지를 완벽하게 감지하는것이 쉽지 않습니다. 머신러닝의 일반적인 이미지 추적 프로세스는 대상이 되는 물체 주변을 박스모양 테두리로 캡쳐하여 레이블을 지정하여 객체를 잡아내는것을 학습합니다. 이런 프로세스는 단순한 환경에서 성공적으로 작동하지만 상황에 복잡해짐에 따라 결과는 달라집니다.

위에 두 사진을 예시로 들어보겠습니다. 왼쪽사진속 인물을 정의하는 것은 쉽지만 오른쪽 사진에 있는 인물을 AI는 어떻게 정의할까요? 사진에서 실제로 보이는 몸부분만 테두리안에 포함시켜야할까요? 아니면 보이진 않지만 어쨌든 몸의 부위로 예상되는 부분까지 테두리안에 포함시켜야할까요? 이런 질문이 사소하게 느껴질수 있지만, 사실은 현 AI 이미지 감지 프로세스의 근본적인 문제를 지적하고있습니다. 아직까진 모든 객체를 완벽하게 정의할 방법은 없습니다. 이 두 번째 이미지가 보여 주듯이 현실 세계에서는 깔끔하게 '딱' 떨어지는 것이 없으며 "정답"이라는 개념 자체가 모호합니다. 하지만 머신러닝 시스템이 트레이닝 데이터를 통해 현실 세계에 이해하기 위해서 접근할땐 이런 부분을 반영하지 못합니다. 불확실성과 모호함을 인식하기보다는 트레이닝 용 데이터를 기반으로 실제 상황에 접근하며, 이러한 접근방식은 시스템과 사람에게 리스크로 작용할 가능성을 내포하고 있습니다. University of Illinois의 컴퓨터 공학 Brian Ziebart 교수는 인공 지능 시스템의 고유한 불확실성 속에서 AI 시스템의 작동 능력을 향상시키기위한 연구를 수행하고 있습니다. 그는 "실제세계는 디지털화된 가상현실과는 다르게 예측불가능한 요소들이 가득하기때문에, 우리가 AI 시스템을 신뢰하기 위해선 우선적으로, AI 시스템이 이런 예측불허한 상황을 처리할 수 있는 능력이 선행되어야한다"라고 말합니다.

제한된 데이터에서 비롯된 AI의 잘못된 확신

머신러닝 시스템은 필연적으로 트레이닝 데이터에서 배우지 못한 실제 상황에 직면하게될것입니다. 그러나 Ziebart 교수는 "현재 데이터로 사용되고 있는 통계 모델들은 미래의 데이터들이 과거의 데이터와 흡사할 거라고 추정하는 경향이있다"고 설명합니다. 결과적으로 이 로직을 바탕으로한 머신러닝 시스템은 심지어 새로운 데이터가 발생했다 할지라도 의심의 여지없이 어떻게 대처해야할지 과한 확신에 차있습니다. 이로서 잘못된 추정이 나올 수 있으며 위험한 결과를 초래할 수 있습니다.

자가 운전 차량에 사용될 이미지 감지 AI의 사례를 생각해볼까요? 다른차량의 데이터를 바탕으로 자가 운전 차량의 이미지 감지 AI를 트레이닝 시켰다고 합시다. 그렇다면 위에 보이는 이미지처럼 주변의 객체를 테두리처리하고 레이블을 달면서 주변 이미지들을 정의하려고 할겁니다. 위의 사진을 봤을땐 모든 객체가 선명하기때문에 이미지 감지기능은 탁월하게 작용할 수 있습니다. 하지만 실제상황에서는 어떨까요? AI 이미지 탐지기가 깨끗하고 선명한 이미지들을 가지고 트레이닝 되었다면 현실세계에선 낮시간때나 80%의 정확도를 보여줄 것입니다. 그리고 밤시간때나 비가오게된다면 정확도는 40%의 인식률로 떨어지게 되겠죠. 낮시간에 수집한 데이터를 가지고 밤시간에 적용시킨다면 당연히 잘 작동하지 않겠죠. 게다가 머신러닝 시스템은 문제 인식조차 못할 수도 있습니다. 왜냐하면 시스템 입장에서는 지금까지 학습된 내용이 모든 경우의 수를 커버한다고 추정하기 때문이죠. 그리고 이는 시스템의 잘못된 예측과 의사결정을 야기하게되고 시스템은 이것조차 '옳다'라고 판단하게 됩니다. 반대로, 사람의 감지 프로세스는 어떨까요? 사람은 자신의 이전 경험을 일반화하여 새로운 상황에 적용시키지 못할땐, 이에 대해 재인식하려는 경향이 있습니다. 예를 들어, 한번도 보지 못한 물체가 한 운전자 길목에 놓여진다면, 그 운전자는 그냥 그 물체를 못본척 지나가지 않습니다. 속도를 줄이면서 다른 차량들이 이 물체에 대해 어떻게 반응하는지를 관찰하기 시작하죠. 그리고 그 물체를 조심스럽게 비켜가려고 합니다. 인간은 주변환경에 대해 불확실성을 느낄때 위험한 실수를 저지르지 않기위해서 주의를 기울입니다. Ziebart 교수는 인공 지능 시스템이 이런 불확실한 상황에서도 인간과 비슷한 수준의 주의를 기울여야할 필요가 있다고 말합니다. AI는 잘못된 확신을 가지고 실수를 저지르는것 대신, 인간과 마찬가지로 '불확실성'을 인식하고 더 많은 정보를 수집할 수 있도록 끊임없이 질문해야합니다.

그렇다면 이에대한 대안적인 접근방법에는 무엇이 있을까?

AI가 오직 트레이닝과 실습만을 통해서 발생 가능한 모든 상황에 대처할 수는 없겠지만 AI 연구원들은 트레이닝 방법을 좀 더 정교하게 설계한다면 이에 대한 대한책을 고안해낼 수 있을것입니다. Ziebart 교수는 트레이닝 시 혼란을 야기할 수 있는 불명확한 데이터를 공급함으로써 AI는 불확실성을 더 잘 인식하고 해결할 수 있도록 훈련 될 수 있다고 말합니다. AI와 다르게 인간은이 이러한 불확실한 요소가 사방에 분포된 실제 현실세계에서 살아가고 있기때문에 '불명확한 상황'에 이미 훈련되었습니다. 실제 사람들을 고용하여 자동차, 사람, 개, 나무 등의 특정 물체를 인간의 기준으로 테두리 처리하게된다면 "정상적인"데이터가 어떤 모습인지에 대한 더 정확하게 분류할 수 있을것입니다. 예를 들어, 10명의 사람들에게이 객체를 테두리 처리하라고 요청하면 10개 케이스 모두 다른 결과를 얻게될 것입니다. 이는 사람마다 진실에 대해 어떻게 생각하는지에대해 다른 근거를 기반으로 하며 즉, '모호함'을 의미합니다. 머신러닝시 혼란스럽고 상반되는 데이터를 제공한다면 모호성을 대비할 수 있도록 훈련시킬 수 있을것입니다. Ziebart 교수는 "우리는 트레이닝 과정에서 데이터 '노이즈'를 합성한다고 말합니다. 노이즈는 현실 세계의 무질서함을 반영하고 새로운 환경을 신중하게 예측할 수 있도록 트레이닝시키는데 도움을 줍니다. AI는 혼란스러운 상황에서 신중하게 추가 정보를 찾고 탐색하는 법을 배우게 되는것이죠. 앞서 언급한 예시에서 자가운전자동차 길목에 새로운 물체가 나타날 경우, 이 물체가 무엇인지 바로바로 파악은 못하겠지만 적어도 '불확실성'앞에서 신중한 태도를 취하는 AI를 개발할 수는 있을것 입니다.

출처 : https://futureoflife.org/2018/03/15/how-ai-handles-uncertainty-brian-ziebart/?cn-reloaded=1

#kr #jjangjjangman #ourselves #kr-news