인공지능 번역의 실제 : 구글 번역 최고 담당자 마이크 슈스터

in #kr6 years ago (edited)

안녕하세요. 뉴비 철학자입니다.

저번에 올린 포스팅 '인공지능이 고전을 번역할 수 있을까? (인간 번역 대 기계 번역)'에 대해 많은 분들이 의견과 질문을 개진해 주셨습니다(페이스북 댓글 포함). 그 문제들 중 몇 가지에 대해 답하겠습니다. 먼저 제기되었던 내용 몇 가지를 정리하면 이렇습니다.

  1. 작가의 의도 파악은 불가능하다. 즉 인공지능은 언어의 의미 파악을 못한다. (@genius0110 @peterchung)

  2. 인간도 이해 능력이 충분치 않지만, 실패들이 쌓이다 보면 좋은 번역에 이르듯이, 인공지능도 처음에는 부족함 점이 많겠지만, 결국에는 인간만큼의 번역물을 내놓을 것이다. (@bonyjo)

  3. 이 분야 최첨단에서 실질적으로 연구를 하는 사람이 아니라면 이러한 문제에 대하여 답을 내는 것이 가능할까요? (@yongja7)

  4. 인간이 만들어놓은 데이터들과 패턴들에 전혀 의존하지 않고 독학으로 바둑을 배운 '알파고 제로'는 어떠한가. (@bobos85)

  5. 결국 인간도 인간의 데이터로 부터 배우는 것이니, 인공지능이 인간이 제공하는 데이터를 필요로 하는 게 딱히 인공지능의 한계라고 할 수는 없지 않을까 싶네요. (페이스북 김성완 님)

모두 좋은 의견, 질문입니다. 이 중에서 이번 포스팅은 대략 2, 3, 5와 관련한 답이 되겠습니다. 특히 제가 최첨단 전문가가 아니기 때문에 신뢰하기 어렵다는 부분은 한편으로는 맞지만 다른 한편으로는 틀리다고 말씀드리겠습니다. 왜냐하면 저는 자주 '최첨단 전문가'의 의견을 참조했기 때문입니다(지금까지는 주로 페이스북에서 그렇게 해왔습니다).

여기부터가 중요합니다.

2017년 가을에 이런 행사가 열렸습니다.

  • 행사명 : 스마트클라우드쇼2017
  • 일 시 : 2017년 9월 14일(목)~15일(금) 09:00-17:00
  • 장 소 : 웨스틴조선호텔 그랜드볼룸
  • 주 최 : 과학기술정보통신부, 서울특별시
  • 주 관 : 조선비즈, 정보통신산업진흥원
  • 미디어 후원 : 조선일보, TV조선, 이코노미조선

이 행사에서 기조연설을 한 '현장 전문가' 중 한 사람이 마이크 슈스터(Mike Schuster) '구글 번역(Google Translate)'('구글 번역기'가 아닙니다) 최고 담당자입니다. 슈스터는 2006년부터 구글에서 언어인식, 기계학습, 신경망 분야 연구개발을 맡았고, 최근에는 '구글 번역'에 신경망과 기계학습을 적용한 번역 기술 개발을 주도해서, 기존의 구(句) 기반 기계 번역(Phrase-Based Machine Translation, PBMT)을 혁명적으로 개선한 구글 신경망 기계 번역(Google Neural Machine Translation system,GNMT)을 선보여 큰 성공을 거두었습니다(2016년 9월 27일). 구글 번역은 구글 브레인팀에서 3명으로 시작해 현재 200명 이상의 개발자가 팀을 이루고 있습니다.

(참조 기사(영어): A Neural Network for Machine Translation, at Production Scale ; 개발 과정에 대한 한국어로 된 아주 흥미로운 (번역) 기사 : 차원이 다른 구글 번역기의 도래 (1) 및 그 원문인 뉴욕타임즈 기사(영어) The Great A.I. Awakening ; 기계 번역의 이런 혁신에 대해서는 제가 쓴 "인공지능의 시대, 인간을 다시 묻다"의 1장 3절에서 자세히 분석했습니다.)

바로 그 수퍼스타 슈스터가 한국에 와서 기조연설을 하고, 주최한 신문사와 인터뷰를 했습니다. 그런데 그런 그가 이렇게 말합니다.

  • “아무리 기계의 번역 기술이 좋아져도 번역기가 인간의 통·번역 활동을 완전히 대체할 수는 없고 인류는 여전히 외국어를 학습해야 한다.”
  • “언어는 단순히 도구가 아니라 그 이상의 것”이며, “언어를 학습하는 것 자체가 도구를 쓰는 게 아니라 소통하고 내 자신의 생각을 정리하고, 언어가 상징하는 문화를 소화하는 것이기 때문에 꼭 필요하다.”
  • “사람의 대화는 문화적 차이뿐만 아니라 상황에 따라 발생하는 언어의 의미나 소통 중에 사용하는 표정, 제스처 등에 따라 달라진다.”
  • “단어로만 내용을 전달하는 것이 아니기 때문에 번역기가 인간을 완전히 대체하는 시점은 어떻게 보면 오지 않을 수도 있다.”
  • “과거 사람들에게 엑셀로 편하게 수식을 계산하는 것은 상상하기 힘들겠지만 현재 인류에게는 보편적인 것으로, AI도 그와 비슷하게 볼 수 있다.” (인터뷰 출처)

이것이 세계 최고의 기계 번역 전문가가 직접 말한 내용입니다. 슈스터는 자기가 하는 일이 무엇인지 알기 때문에 결코 과장할 수가 없습니다. 저는 책을 쓰면서 기계 번역의 원리를 직접 들여다봤고, 최대한 쉽게 풀어 설명하려 했습니다. 물론 이 인터뷰는 책이 인쇄되던 중에 나온 것이어서 책에 싣지는 못했지만, 슈스터와 제가 구글 번역의 원리에 대해 이미 이해를 공유하고 있는데, 권위자의 의견이 뭐 그리 중요할까 싶기도 합니다.

기회가 되면 알파고 제로와 강화학습에 대해 포스팅하겠습니다. 요즘 너무 바빠서 차분히 글 쓸 시간이 주어지지 않네요. ㅠㅠ

Sort:  

언어는 단순히 도구가 아니라 그 이상의 것”이며, “언어를 학습하는 것 자체가 도구를 쓰는 게 아니라 소통하고 내 자신의 생각을 정리하고, 언어가 상징하는 문화를 소화하는 것이기 때문에 꼭 필요하다.

이 말은 저도 참 동의하는 말입니다. 사람이 외국어를 배운다는 것은 단순히 도구만을 얻는 것이 아니라 그 문화를 받아들이는 것이니, 외국어 학습은 없어지지 않을 것이라 생각합니다.

  • “사람의 대화는 문화적 차이 뿐만 아니라 상황에 따라 발생하는 언어의 의미나 소통 중에 사용하는 표정, 제스처 등에 따라 달라진다.”
  • “단어로만 내용을 전달하는 것이 아니기 때문에 번역기가 인간을 완전히 대체하는 시점은 어떻게 보면 오지 않을 수도 있다.”

이 말들은 줄글 번역에 대한 말이 아니라 통역에 대한 말이로군요. 역시 표정이나 주변 상황을 인식하고 해석하지 못하면, 제대로된 통역을 할 수 없겠네요. 통역에 비하면 문학의 번역이 좀더 쉬운 수준이겠습니다.

예전에 구글 번역 기술 관련하여 정리한 글을 페북에 써 놨던 적이 있습니다 ㅎ 내용은 대동소이합니다

https://www.facebook.com/Ebenezel/posts/10202926188712506

잘 보고 풀보팅해드렸습니다^^

구글 번역 최고담당자의 말이라니.. 좀 놀랍네요 ㅋㅋ
외국어 배우기를 미뤄두고 기계가 빨리 진화하기만을 기다리고 있었는데 ㅠ ㅋㅋㅋ

하하. 외국어 배우는 과정은 힘들지만, 그 과정에서 배우는 게 많아 보람차기도 하지요.

좋은글 감사합니다!!

저도 글 잘 보고 있습니다. 많이 배우고 있고요.

제 친구 중에서도 정작 인공지능 분야에서 근무하는 친구는, 인공지능의 대체에 대해 상당히 회의적이더군요.... 우리 은퇴할 때까지는 문제 없으니 일 열심히 하라고 ㅋㅋ

현장에서 일하는 분은 모두(!) 그렇게 말씀하지요.

빅데이터 기반으로 데이터가 좀 더 많이 쌓인다면
충분히 왠만한 번역은 기존 데이터로 대조해서 번역이 가능하지 않을까 싶습니다. 얼마나 걸리느냐의 문제이지.... 이미 답은 나온 것이 아닐까 싶습니다.

지금까지 쌓인 데이터보다 훨씬 질이 좋은 데이터가 필요한데, 그게 굉장히 시간과 노력이 필요한 일이라서요. 사람이 해야 하는 일이어서요. 근데 고전에는 아무도(?) 관심을 두지 않거든요.

Congratulations @armdown! You have completed some achievement on Steemit and have been rewarded with new badge(s) :

Award for the number of upvotes received

Click on any badge to view your own Board of Honor on SteemitBoard.

To support your work, I also upvoted your post!
For more information about SteemitBoard, click here

If you no longer want to receive notifications, reply to this comment with the word STOP

Upvote this notification to help all Steemit users. Learn why here!

thanks a lot!

인간을 완전히 대신할 번역기가 나올 가능성은 거의 없다는 결론이네요. 다행이라고 해야할지,,,

그런게 나오면 전세계 사람들과 소통하는데 아무 불편함이 없어서 좋을듯 한데, 한편 아쉽네요.

대강 소통하는 데는 많은 도움을 받을 수 있을 겁니다. 뉘앙스까지 붙잡긴 어렵지만요.
외국어를 배우는 어려움 말고 재미는 남을 겁니다.
요즘 너무 바빠서 연재를 저장만 해두고 있는데, 따라가며 열심히 읽을 게요.

언제가 될지는 모르지만, 인류가 서로간에 소통을 너무 원하고, 오해받는 일이 없어지길 원하는 마음이 너무 강해서 저는 인공지능이 인간 이상으로 발전하리라고 보는 1인 입니다. 그 기술적인 문제야 기술자와 과학자들의 몫이지만 인류가 뿜어내는 에너지가 기술이 핵심이라고 생각하거든요.
언어의 문제를 해결했을때 인류가 어떻게 번영할지... 생각만으로도 너무 벅찬 감동이 몰려오네요.

Upvoted ☝ Have a great day!

Coin Marketplace

STEEM 0.26
TRX 0.11
JST 0.033
BTC 64678.67
ETH 3086.68
USDT 1.00
SBD 3.87