2018년의 인공지능 AI 테크 트렌드 TOP 10
오늘날의 AI(인공지능)은 기업뿐만 아니라 정부에서도 어떤 식으로 접근해야 하는 지에 대해 매우 조심스러워하는 영역 중 하나입니다. 그런데 학계 및 사립 기업형 연구원들의 여러 시도들과 새로운 발견들이 앞으로의 AI개발에 있어서 얼마나 공유되고 있을까요? PwCAI Accelerator의 PwC 연구팀은 이러한 선도적인 움직임에 동참하여 테크 관계자들과 비즈니스 리더들에게 인사이트를 주고자합니다.
1. 딥 러닝 이론 : 뉴럴 네트워크 작동원리에 대한 정확한 이해 및 설명
인간의 뇌를 모방 한 딥 뉴럴 네트워크는 이미지, 오디오 및 텍스트 데이터를 "학습"하는 능력을 입증해왔지만, 10년 이상을 사용해온 지금에도 뉴럴 네트워크가 학습하는 방법이나 어떻게 딥 뉴럴 네트워크가 잘 수행되는지 조차 우리는 딥 러닝에 대해 아직 많이 알지 못하는게 사실입니다. 하지만, 정보 병목 현상의 원리를 딥러닝에 적용하면 어떨것이냐는 새로운 이론을 눈여겨 본다면 현재에 새로운 변화를 불러일으킬지도 모르겠네요. 이 이론의 본질은 초기 피팅 단계가 끝나면 딥 뉴럴 네트워크는 잡음이 많은 데이터.. 즉, 의미없이 많은양의 정보만 포함 된 데이터 세트를 "기억에서 상실"하고 남은 데이터만 압축하면서 데이터가 나타내는 내용에 대한 정보를 보존하게된다는 것입니다. 뉴럴 네트워크 작동원리에 대해 이해한다는 것은 딥 러닝에 대한 정확히 이해하여 현재보다 더 앞선 개발과 딥 러닝 사용을 가능하게합니다. 예를 들어, 최적의 네트워크 설계 및 아키텍처 선택에 대한 통찰력을 제공할 수있을 뿐만 아니라 중요한 보안성 문제 혹은 규제 적용에 있어서 투명성을 높일 수 있으며, 다른 유형의 딥 뉴럴 네트워크 및 딥 뉴럴 네트워크 설계에 이 이론을 적용하게 된다면 더 많은 결과를 기대할 수 있을 거라고 하네요.
2. Capsule 네트워크 : 뇌의 시각적 처리 강도 에뮬레이션
새로운 유형의 딥 뉴럴 네트워크 인 Capsule 네트워크는 시각 정보를 두뇌와 거의 같은 방식으로 처리여 계층적 관계를 유지할 수 있습니다. Capsule 네트워크는 가장 널리 사용되는 뉴럴 네트워크 회로망 중 하나 인 나선형 뉴럴 네트워크와는 상당히 대조적인데, 나선형 뉴럴 네트워크는 높은 사용율대비 단순한 객체와 복잡한 객체 사이의 중요한 공간 계층 구조를 잘못된 분류하여 높은 오류율이 발생하곤 합니다. 그렇기 때문에 Capsule 네트워크는 일반적인 식별 작업의 경우 오류를 감소시킴으로써 정확도를 50%나 높일 수 있습니다. 또한 이를 위해 많은 양의 데이터가 필요하지 않기때문에 많은 영역에 걸쳐 딥 뉴럴 네트워크 아키텍처에서 캡슐 네트워크가 광범위하게 사용되는 것을 예상할 수 있습니다.
3. 심층 강화 학습(Deep Reinforcement learning) : 비즈니스 문제를 해결을 위한 환경적 상호 작용
심화 강화학습이란 관찰, 행동 및 보상을 통해 주변환경과 상호 작용하여 학습하는 유형의 뉴럴 네트워크입니다. 심화 강화 학습(DRL)은 Atari 및 Go와 같은 게임 전략을 배우는데 사용되어왔습니다. 인간을 이겨내서 유명해진 AlphaGo 프로그램을 이에 대표적인 예라고 볼 수 있겠네요. 심층 강화학습이 왜 주목받고있을까요?DRL은 모든 학습법의 가장 일반적으로 추구되고 있기에 폭넓은 비즈니스영역에서 적용하여 사용될 수 있습니다. 한 모델을 훈련시키는 데있어서 다른 기술보다 적은 데이터가 필요하며, 더욱 주목할만한 점은 시뮬레이션을 통해 교육을받을 수 있기때문에 레이블이 지정된 데이터가 필요하지 않다는 이점이 있습니다. 이러한 이점에서 머지않아 DRL과 에이전트 기반 시뮬레이션을 결합하는 더 많은 비즈니스 어플리케이션을 기대할 수 있지 않을까요?
4. 생산선 적대 네트워크(Generative adversarial networks) : 네트워크를 연결하여 Paring학습으로 데이터 처리 부하를 줄인다?!
생산적 적자 네트워크(Generative adversarial network, GAN)는 두개의 경쟁구도 뉴럴 네트워크를 구현한 비감독(Unsupervised) 형태의 딥 러닝 시스템의 한 유형입니다. 두개의 경쟁 네트워크 중 첫번째 네트워크인 '생성기(Generator)'는 실제 데이터 세트와 정확히 일치하는 가짜 데이터를 생성합니다. 그리고 두번째 네트워크 인 '판별기(discriminator)'는 실제 및 합성 데이터를 수집합니다. 시간이 지나면 각 네트워크가 향상되어 Paring 학습을 하고 데이터 세트의 전체를 학습 할 수 있습니다. GAN은 분류된 데이터가 존재하지 않거나 너무 비싸서 얻을 수 없는 더 넓은 범위의 비감독 작업에 대해 딥 러닝을 가능하게 또한, 두 네트워크가 Burden을 공유하기 때문에 딥 뉴럴 네트워크에 필요한 로드를 줄입니다. 사이버 탐지와 같은 비즈니스 어플리케이션이 GAN을 더 적극적으로 사용하게 될 것으로 기대됩니다.
5. 린(lean) & 확장된 데이터 러닝 : 레이블이 지정된 데이터에 대한 챌린지
러신머닝 (특히, 딥 러닝)에서 가장 큰 과제는 시스템을 트레이닝하기 위해 대량의 라벨 데이터를 사용할 수 있게하는 것입니다. 두 가지 광범위한 기술을 통해 (1) 새로운 데이터를 합성하고 (2) 하나의 작업 또는 도메인에 대해 교육 된 모델을 다른 것으로 전송할 수 있습니다. 전송 학습 (습득 한 인사이트를 한 작업/도메인에서 다른 작업/도메인으로 전송) 또는 원샷 학습 (관련 사례가 하나 또는 전혀없는 상태에서 학습된 내용을 전송)과 같은 기술은 "린 (lean) 데이터"학습법을 만들어 냅니다. 마찬가지로 시뮬레이션이나 해석을 통해 새로운 데이터를 합성하면 더 많은 데이터를 얻을 수 있으므로 기존 데이터를 보강하여 학습을 향상시킬 수 있습니다. 이러한 기술을 사용하면 다양한 문제, 특히 과거 데이터가 적은 문제를 해결할 수 있습니다. 린(lean) 및 확장 된 데이터의 다양한 변형뿐만 아니라 광범위한 비즈니스 문제에 적용되는 다양한 유형의 학습을 기대해 볼 수 있습니다.
6. 확률 프로그래밍 : 모델 개발을 용이하게하는 언어
이는 개발자가 확률 모형을 쉽게 디자인 할 수있게 해주고 이러한 모델을 자동으로 "해결"하는 고급 프로그래밍 언어인데요, 확률 프로그래밍 언어는 모델 라이브러리를 재사용하고, 상호 작용 모델링 및 형식 검증을 지원하고, 보편적 인 모델 클래스에서 일반적이고 효율적인 추론을 촉진시키는 데 필요한 추상화 계층을 제공하는 것을 가능하게합니다. 확률 프로그래밍 언어를 통해 비즈니스 영역에서 흔히 발생하는 불확실하고 불완전한 정보를 수용할 수 있게되는 것이죠. 그러기때문에 이 언어를 더 많이 채택 할 것이며, 또한 이를 통해 딥 러닝에도 적용될 것을 기대해 볼 수 있게되는 것이죠.
7. 하이브리드 학습 모델 : 모델 불확실성에 대한 결합 접근법
GAN 또는 DRL과 같은 다양한 유형의 딥 뉴럴 네트워크는 성능 및 다양한 유형의 데이터로 널리 적용된다는 측면에서 큰 가능성을 보여줍니다. 하지만 딥 러닝모델은 불확실성, 베이지안(Bayesian) 방식 또는 확률론적 방식을 모델링하지 않습니다. 하이브리드 학습 모델은 각각의 장점을 활용하기 위해 이 두가지 접근 방식을 결합하는 방식입니다. 하이브리드 모델의 예로는 베이지안 딥 러닝, 베이지안 GAN 및 베이지안 조건부 GAN이 있습니다. 하이브리드 학습 모델을 사용하면 불확실성을 담고있는 딥 러닝을 포함하여 다양한 비즈니스 문제역역를 확장 할 수 있습니다. 이로서 모델의 더 나은 성능과 설명을 가능성하게 해주며, 딥 러닝이 더 널리 보급 될 수 있겠죠. 확률론적 프로그래밍 언어의 조합이 딥 러닝을 통합하기 시작하는 동안, 딥 러닝 방법이 베이지안 방식과 같은것들을 얻는것을 기대볼 수 있겠습니다.
8. 자동화 머신러닝(AutoML) : No 프로그래밍
러닝머신 모델을 개발하려한다면 데이터 준비부터 시작하여 어떤 기능을 담을지, 모델 또는 어떤 기술을 채택할지를 하나하나 설계하여야하며 교육 및 튜닝을 포함하여 개발 시간이 많이 걸리기에 전문가 중심의 워크 플로가 필요합니다. AutoML은 다양한 통계 및 심층 학습 기술을 사용하여 이러한 워크 플로를 자동화하는 것을 목표로합니다. AutoML은 인공지능의 민주적인 도구로 간주됩니다. 이 말은 즉슨, 비즈니스 사용자가 심도있는 프로그래밍 배경없이 머신러닝 모델을 개발할 수있게 해줍니다. 또한, 데이터 과학자가 모델을 만드는 데 걸리는 시간도 단축됩니다. 더 많은 상업용 AutoML 패키지와 대형 러닝머신 플랫폼에서의 AutoML 통합을 기대해볼 수 있겠네요.
9. 디지털 트윈 : 산업용 애플리케이션을 뛰어 넘는 가상복제
디지털 트윈은 신체 또는 심리적 시스템에 대한 상세 분석과 모니터링을 돕는 가상 모델입니다. 디지털 트윈의 개념은 풍차 농장이나 기타 산업 시스템등과 같은 것들을 폭넓게 분석하고 모니터하기 위한 산업적인 목적에서 시작되었습니다. 이제는 에이전트 기반 모델링(자율 에이전트의 동작 및 상호 작용을 시뮬레이션하기위한 모델)과 시스템 역학 (정책 분석 및 설계에 대한 컴퓨터 지원 접근 방식)을 사용하여 디지털 트윈이 '고객 예측'하는 것을 포함하여 비물리적 개체 및 프로세스에도 적용되고 있습니다. 디지털 쌍둥이는 IoT 시스템을 예측/진단하고 유지하는 방법을 제공하여 사물의 IoT 개발을 촉진시키며 이러한 개발 사항들이 광범위하게 채택될 수 있도록 할 수 있습니다. 앞으로는 '물리적 시스템'과 '소비자 초이스 모델링' 모두에서 디지털 트윈을 더 많이 사용할 것으로 기대됩니다.
10. 설명가능한 AI : 블랙 박스의 이해
오늘날, 다양한 응용 프로그램에서 감지, 사고 및 행동에 있어서 머신러닝 알고리즘이 많이 사용되고 있습니다. 그러나 이러한 알고리즘 중 많은 부분이 "블랙 박스"속에 감춰져있어 어떻게 결과에 도달했는 지 알아내는 데는 어려움이 있습니다. '설명 가능한 AI'는 예측 정확도를 유지하면서 인과관계 설명이 가능한 모델을 생산하는 머신 러닝 기술을 개발하려는 움직임이라고 보시면 되겠네요. '설명/증명이 가능하며 투명성을 갖춘 인공 지능'은 기술에 대한 신뢰를 구축하는 데 중요하며, 이를 바탕으로 머신러닝 기술의 채택을 더욱 장려될 것이라고 보고 있습니다. 기업은 인공 지능의 보급에 착수하기 전에 '설명 가능한 AI'를 요구 사항 또는 모범 사례로 채택할 것이며, 정부는 '설명 가능한 AI'를 미래의 규제 요구사항에 포함시키지 않을까요?
출처 : http://usblogs.pwc.com/emerging-technology/top-10-ai-tech-trends-for-2018/
짱짱맨 호출에 출동했습니다!!