머신러닝(Machine Learning) : 데이터가 아닌 지식을 학습한다? 딥클로닝 vs 딥러닝

in #kr-newbie7 years ago

머신러닝(Machine Learning) 분야에 대해서 많은 사람들이 데이터 사이언스만의 독점적인 영역으로 이해하고 있는데요, 사실 이건 잘못된 사실입니다. 머신러닝의 주요 목적은 컴퓨터가 인간의 두뇌와 같은 인지기술을 수행하도록 하고, 인간의 두뇌가 어떻게 학습하고 생각하는지를 모방하는 것입니다. 현재까지 이런 연구를 위해 오직 데이터만 사용해왔습니다. 하지만 사실 인간이 학습을 할때는 '지식'을 기반으로하고 있습니다. 인간의 두뇌는 대부분 '데이터'가 아니라 '지식'에서 배웁니다! 결국, 이런 측면에서 '지식'을 바로 사용하는 머신러닝 방법이 필요합니다. '지식 표현 (KR: Knowledge Representation)에 대한 도전적인 부분과 전산화된 온톨로지(Ontology) 작성의 어려움으로 인해 이 분야의 연구는 딥러닝(Deep learning)만큼 진행되지 못했습니다. 시맨틱 네트 (semantic net), 논리 및 언어 모델링 (logicalo-linguistic modeling)과 같은 KR 방법은 정적이면서 주어진 지식을 사용하는 R&D의 오랜 역사를 가지고 있지만 "학습"의 맥락에서는 그렇지 않습니다. 그렇기 때문에 문제는 '우리가 어떻게 KR 방법을 '학습'방법으로 확장 할 수 있는가'입니다. 그리고 이것은 KR방법이 신경 네트워크와 같은 구조로 전환되어 리딩(reading)을 통한 학습을 할 수 있는 딥 클로닝(Deep Cloning)에 대한 새로운 아이디어를 불러왔습니다.

컴퓨터가 리딩(Reading)을 통해서 학습이 가능하다?!


지식기반 학습방법은 컴퓨터가 인간이 학습하듯이 리딩(Reading)을 통해서 학습을 가능하게 합니다. 일단, 딥 클로닝 시스템이 설정되면 컴퓨터는 책(텍스트)을 읽으면서 여러 주제를 배우고 이에 대한 질문에 답할 수 있게되는 것이죠. 단지, 온톨로지(지식 기반)학습이 어렵지만 대용량 데이터(Corpus) 트레이닝을 일단 이뤄내면 독립성을 유지할 수 있다는 이점이라는 부분과 '일반화'를 시켜버리는 것이 아니냐는 이유에 대해서 어떻게 대처할 것인가라는 부분이 서로 상충되고 있습니다.

지식기반 학습의 이점 3가지


데이터 기반 학습과 비교할 때 '지식기반 학습' 접근 방식에는 여러 가지 장점이 있습니다.

1. 빠르고 간결한 학습
'지식'에는 기준점이 필요 없기 때문에 딥러닝에서 발생하는 수렴성 문제가 없어 빠르고 간단하게 학습이 가능합니다.

2. 과거 지향적이지 않다
데이터 기반 학습은 과거 경험으로부터 수집 된 데이터를 필요로합니다. 즉, 이는 새로운 자동차, 신형 비행기, 신약 등 새로운 것을 학습하는 것에 대해서 취약하다는 뜻이죠. 지식 기반 시스템은 과거에 편향되어 있지 않기때문에 즉시 새로운 지식을 활용할 수 있습니다.

3.데이터의 제한성
풍부한 데이터와 데이터 가용성이 뒷받침되었다고 해도 데이터가 완전하기까지 할까요? 데이터가 어떻게 구성되고 만들어졌는지를 완전히 설명하기엔 여전히 한계가 있습니다. 날씨 예측이 이에 대한 예가 될 수 있겠네요. 반면, 지식은 가용성 뿐만아니라 최상으로데이터를 경험할 수 있는 기반을 제공합니다.

딥 클로닝 vs 딥러닝, 근본적인 차이점엔 뭐가 있을까?

텍스트를 읽은 후 자연 언어를 처리하고 지식으로 전환될 때, 딥 클로닝 네트워크 (그림 왼쪽)는 서로 다른 목적과 다양한 뉴런 기능을 가진 계층으로 구성됩니다. 이와는 대조적으로, 딥러닝 (그림 오른쪽)은 주시된 학습 모드에서 산출물의 오류를 최소화하기 위해 설계된 뉴런의 동질 구조입니다. 딥러닝의 변동성에도 불구하고 어떠한 언어적 역할에도 뉴런 활동이 지정되지 않습니다.
왼쪽 그림의 딥 글로닝에서 KR은 지식의 텍스트만 사용하는 원샷 프로세스를 처리할 수 있지만, 딥러닝에선 딥 클로닝에서 필요로 하는 것보다 훨씬 긴 코퍼스(Corpus) 방법 트레이닝 사이클을 필요로합니다.

질문에 대한 답변

지식 기반 머신러닝은 위의 그림처럼 온톨로지 연결을 사용하여 학습한 내용에서 질문에 답변할 수 있습니다. 오른쪽의 그림은 네트워크에 제시된 질문이 이러한 온톨리지 연결을 사용하여 가장 적절한 답변을 찾는 가상의 사례입니다. 부분만 연결한 경우, 네트워크는 대상, 사건 및 개체 등의... 이 순서에 중점을 두어 정확도 점수를 가지고 답변을 생성합니다. 응용 프로그램의 유형에 따라 최고 점수를 획득한 문장이 임계값보다 낮으면 임계값을 설정하여 "무응답"을 설정할 수 도 있습니다. 이러한 기능을 통해 챗봇(chatbot)은 자신의 성능에 대해 스스로 자각하게 되고 질문 답변에 대해 얼마나 잘 수행하고 있는 지에 대해 레포팅할 수 있게 됩니다. 또한, 이것은 chatbots이 특정 질문에 대답하는 법을 배우기 위해 피드백을 요청하는 '사회 학습'으로까지 확장될 수 있습니다.

새로운 지식을 탄생시킨다?!

질문에 응답하는 기능보다 더 주목할만한 부분은, 딥 클로닝 러신머닝은 오른쪽에 그림처럼 학습한 내용을 바탕으로 새로운 지식을 탄생시킬 수 있다는 것입니다. 이는 '기존 지식을 바탕으로 오돈톨리지컬 연결을 통해 새로운 지식을 산출한다' 라는 논리적 솔루션로 볼 수 있습니다. 분명히, 이런식의 새로운 지식 생성할 수 있다는건 이 학습 알고리즘의 가장 흥미로운 측면 중 하나라고 볼 수 있습니다. 반면, 데이터 기반 딥러닝의 알고리즘은 데이터 중심으로 한 모델이기에 비교적 단순하여 새로운 지식 생성이 어렵습니다. 이 밖에, 지식 중심의 머신러닝의 또 다른 이점 중 하나는 '새로운 지식'의 투명성인데요, 인간의 직접 검사하여 검증할 수 있지만 데이터 기반의 딥러닝에선 바로 그 자리에서 검증하기엔 어려움이 있습니다.

출처 : https://www.linkedin.com/pulse/can-machine-learning-use-knowledge-instead-data-deep-vs-berkan-ph-d/












Sort:  

짱짱맨 호출에 출동했습니다!!

Coin Marketplace

STEEM 0.13
TRX 0.33
JST 0.034
BTC 110917.98
ETH 4291.79
USDT 1.00
SBD 0.82