데이터과학 학습기, 그리고 배움의 다리

in #data-science8 years ago

통계학과 데이터 프로그래밍을 독학한 지 딱 3년이 되었다. 당시에 회사원이었기에 순전히 이직을 위한 것이지만, 약간의 동경도 있었다. 갈 수만 있다면 실리콘밸리 회사에 취업해 보고 싶었다. 아마존, 구글, 애플, 페이스북에 한번쯤은 다녀보는 게 회사원으로서의 정점이 아닐까 하는 생각이 들었다. 제조대기업에서 혁신 업무를 했기에 가능하다면 기술기업(테크기업)에서 기획 업무를 해보고 싶었다. 무엇보다 데이터로 의사결정한다는 회사에서 일을 해보고 싶었다. 프로그래머들이 많이 쓰는 프로그래밍 언어 중 하나인 파이썬(Python)을 배울 때는, 그들의 언어를 이해해 엔지니어들의 문화를 잘 파악할 수 있을 거라는 문화인류학도의 낭만적인 생각도 있었다.

제일 먼저 MOOC(대규모 온라인 공개 강좌)에 발을 들였다. MOOC의 4대 업체로 볼 수 있는 코세라(Coursera), 에덱스(edX), 유다시티(Udacity), 유데미(Udemy)의 영어 강의를 찾아 듣기 시작했다. 코세라와 에덱스는 미국 스탠포드나 MIT 대학 등의 수학과 컴퓨터공학 강의들로부터 시작된 비영리 기반의 교육시스템이다. MIT의 대학 강의를 무료로 배포하는 공개과정(Open Courseware)가 16주의 양식에 맞춰져 있다면, 코세라와 에덱스는 조금 더 적은 주에 강좌와 실습을 편성하고 있다. 유다시티는 ‘작은 학위’라는 뜻의 나노디그리(nanodegree)라는 프로그램을 운영한다. 과정당 300~500달러 정도 수강료를 내에 조금 더 금액을 지불하면 취업 알선도 제공한다. 유데미는 실무 기술을 10~20달러 정도의 적은 돈으로 제공하는 특성을 가진다. MOOC 강의는 수강을 마치고 나면 마이크로소프트가 인수한 세계 최대 구직 포털인 링크드인(LinkedIn)에 수료증을 인증할 수 있게 해준다. 몇 년 새에는 미국 기업과 대학의 MOOC 진출이 점점 더 활발해져 온라인 MBA도 생기고 컴퓨터공학 석사 과정도 생기기 시작했다. MOOC로 배워 링크드인에 게시하여 이직하는 하나의 생태계가 생겨나는 중이다.

미국 프로그래머들과 데이터과학자들이 공부한다는 이런 과정들을 열심히 따라가 수료증을 쌓다 보면, 실리콘밸리가 머지 않을 거란 꿈도 있었다. 1년 남짓 매일 3시간씩을 들여 MOOC의 강좌를 듣고 과제를 풀고 시험을 치렀다. 물론 이러한 과정 수료로 이직이 되지는 않았다. 연락을 받지 못했다. 어디에서건 인정 받을 만한 어려운 과정은 기초 역량의 문제로 곧바로 듣지 못했고, 배운 통계학이나 데이터 분석 지식을 실무와 연관 짓기 어려웠기 때문이다. 과정을 들으면서 교수나 강사들이 하는 영어를 잘 알아듣고 영어 텍스트에 대한 두려움이 사라졌다는 점이 성취이긴 했다.

또 1년은 MOOC를 벗어나서는 국내에서 하는 데이터 분석 스터디를 찾아다니게 됐다. 통계프로그래밍 언어인 R이나 파이썬(Python)을 통한 데이터 분석을 가르치는 모임은 2015년 정도를 지나 부지기수로 늘어나기 시작했다. 저녁 시간, 구글이나 페이스북이 후원하는 피자를 한 조각씩 얻어 먹으면서 기술기업의 프로그래밍 전문가를 불러다가 발표를 듣는 밋업(meet-up)과 유사한 모임이 한국에도 늘어나기 시작했다. 늘 배움에 주린 직장인들과 학생들은 그런 자리를 가득 채우면서 ‘새로운 기술’에 대한 갈증을 채워갔다. 소규모 프로그래머 집단을 넘어 밋업의 외연은 넓어지고 있고, 온라인 커뮤니티에는 깊고 넓은 질문과 답변들이 오간다.

‘빅데이터’, ‘인공지능’, ‘4차산업혁명’이라는 트렌드 앞에서 ‘데이터 과학 교육’은 초등학생들을 타깃으로 한 ‘코딩 교육’과 함께 하나의 거대한 산업이 됐다. 1위 업체인 ‘패스트 캠퍼스’를 비롯 수십 수백 개의 교육기관들이 늘어나기 시작했다. ‘하루 만에 배우는’ 혹은 ‘수학 몰라도 할 수 있는’ 이라는 제목을 붙인 데이터 분석 기법을 가르치는 과목들을 열기 시작했다. 실무와 연관된 단순한 기법 몇 가지를 배우고, 실무 데이터 몇 가지를 응용해서 해결해 보는 간단한 과정들이 늘어났다. 학원이 아니라도 배움터는 늘어났다. “시험에 나오는 것만 공부하는” 입시학원의 트렌드가 “실무에 나오는 것만 배우는” 직업교육의 트렌드로 옮겨간 셈이다.

화려한 데이터 분석 기법을 온라인에서 쉽게 찾아 손에 익히고, 화려한 그래프들도 그릴 수 있게 됐다. 대학에 오기 전 어느 대기업의 데이터분석가로의 마지막 이직 시도를 했다. 화이트보드에 문제를 푸는 면접이었다. 할 줄 아는 기법을 설명하는 내게 면접관은 삼각함수를 활용한 계산과, 조금은 더 심도 있는 수학적 원리를 활용한 알고리즘 문제를 출제했다. 물론 떨어졌다. 내가 익힌 ‘새로운 기술’은 근본이 부족함을 여실히 드러냈다. 면접관은 왜 그런 수학 문제가 현실에 적용되는지를 차근차근 설명해줬다. 기법을 따라하는 게 중요한 게 아니라 원리를 익혀야만 하는 이유를 인상깊게 새기게 됐다. 결국 통계학 기본서와 수학책을 펼쳐 놓고 더듬거리게 됐다. 실무적인 관심이 이론적 탐구로 옮겨간 셈이다.

언젠가 ‘전문가-초심자’라는 미국의 블로그 포스트가 회자된 적이 있었다. 쉬운 지식을 반복적으로 배우다가 자기가 전문가인 줄 알고 착각하게 되는 사람들, 그리고 그러한 문화적 현상에 대한 문제제기였다. 참 많은 “한 권으로 배우는”, “하루에 마스터하기”류의 책들이 많고 비슷한 강좌가 많다. 새로운 기술에 관심을 갖는 사람들의 진입장벽을 낮추는 컨텐츠다. 그런데 관심을 갖고 난 사람들이 그 다음으로 ‘성장’하기 위한, 어쩌면 지루하고 답답한 과정을 도와주는 컨텐츠는 드물다. 데이터 과학의 경우 통계학, 미적분∙선형대수로 대표되는 대학 수학의 최소수준 그리고 프로그래밍에 대한 근원적인 이해가 필요하지만, 이것들을 짚어내는 과정이나 모임은 드물다. (물론 소중한 모임들이 많다.) 어떤 공부든 ‘웃으며 들어가서 울며 나오는’ 경우가 많다는데, 결국 나는 통계학 기본서와 수학책을 펼쳐 놓고 더듬거리게 됐다. 응용으로 시작했다가 결국 이론을 다지게 된 셈이다.

10대였던 90년대부터 많이 듣던 말은 ‘국영수 무용론’이었다. 심지어 젝스키스의 노래 가사에도 "국영수를 우선으로" 해야 한다며 세태를 풍자했다. 지금 생각해 보면 그 말이 함의 하는 방향이 참 많은 것들을 많은 이들에게서 뺏어 온 것이 아닌가 싶다. 쉽게 접근했다가 쉽게 포기하거나 쉽게 만족하게 만드는 것들. 배우는 과정 속에서 겪게 되는 난관, 결국 근본적인 지식들을 다시 필요로 했을 때 그것들을 습득할 수 있는 지적 성실성 이러한 것들을 훈련시키는 과정이 우리에게는 너무나 절실하다. 그 와중에 ‘단번에’ 가르치겠다고 자랑하는 ‘업자’들의 시장만 커지는 중이다.

‘경험 기반 학습’의 시대다. 체험하고 익히는 과정과 흥미 유발은 분명 필요하다. 그러나 결국 배우는 모두는 어떤 지점에서 한계에 봉착할 수밖에 없다. 데이터 과학이든 영어든 마찬가지다. 그 지점에서 공부에 서툰 이들에게 ‘전문가-초심자’를 넘어서 진짜 전문가를 만들 수 있게 하는 다리. 이미 자기주도 학습에 익숙한 이들은 그 다리를 나름의 노하우로 스스로 만들고 건너간다. 그 다리가 부실해 보인다. ‘어려운 것’ 대신 ‘쉽게 할 수 있는 것’만 강조하는 기조가 사라져야 한다. 기본을 단단히 해 어려운 걸 극복하고 다음 단계로 넘어갈 수 있게 하는 교육 철학이 와야 하지 않나 싶다. 알아서 열심히 공부하는 이들 말고, 뭔가 흥미를 유발해야만 학습에 참여할 수 있는 이들을 일정 수준 이상까지 끌어올리는 방향. 그들을 더 나아가게 할 다리가 필요하다.

https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRfTZimIxhAsQN09sVT145WPSNAomjBtjsmAkHNUuFXrutE741o

Coin Marketplace

STEEM 0.04
TRX 0.32
JST 0.084
BTC 61485.93
ETH 1592.52
USDT 1.00
SBD 0.47