과학글 시리즈 : SNS 분석방법을 통한 역사의 진실 찾기
지난 글
안녕하세요~
과학 비전공자들도 흥미롭게 읽을 수 있는 과학 글쓰기를 목표로 하고 있는 dodomam 입니다~
오늘 소개해드릴 연구는 소셜 네트워크 시스템(Social Networking System) 분석 방법을 이용하여 실제 역사 연구에 응용한 사례입니다. 어떻게 Facebook이나 Steemit에 쓰일법한 친구 분석방법을 실제 역사에 사용되었는지 흥미로워 보여서 이번 주제로 선정하게 되었습니다.
(The Battle of Clontarf, by Hugh Frazer, 아일랜드 통일 전쟁, 그림출처 : 위키피디아 )
이 연구에서는 우리에게 친숙하지 않은 역사인 아일랜드의 역사에 대해서 분석을 하였는데요, 먼저 간단히 배경 역사 설명을 드리자면, 10세기에서 11세기 경의 아일랜드는 대략 50만명 내외의 인구에 각 지방의 왕만 150여명에 이르는 매우 혼란 스러운 상황이었습니다. 그리고 역사가들의 논란이 있지만, 바이킹족에 의한 수탈과 지배를 당하던 시대적 배경을 가지고 있습니다.
이때 King Brian Boru는 무려 50년에 걸쳐 바이킹족과의 전쟁을 통해 아일랜드를 하나로 통합시키고, 아일랜드를 바이킹족의 지배력으로 부터 해방시켰는데요. 이후로 아일랜드인은 하나의 나라라는 정체성을 확립하게 되었고 King Brain Boru를 Great Hero King이라고 부르며 후대에 칭송을 받게 됩니다. (마치 브리튼의 킹 아서와 같은 왕)
(Brian on the morning of Clontarf, 아일랜드의 기독교 영웅왕 King Brian 출처 : 위키피디아)
하지만 앞서 설명했듯이 바이킹족이 아일랜드를 실제 지배하지 않았다고 생각하는 역사가들에 의해서 이러한 이야기는 의심을 받게 됩니다. 과연 Brian Boru는 아일랜드 국민을 바이킹의 억압에서 해방시킨 해방자인가, 아니면 단순히 소국으로 쪼개져있던 아일랜드를 정복하고 그 명분으로 바이킹으로부터 해방시켰다고 내세웠을 뿐인가?
이 문제는 계속해서 풀리지 않는 논쟁거리였는데요, 최근에 이에 대해 Facebook에 쓰이는 친구관계 분석 프로그램을 활용하여 분석한 연구가 Royal Society Open Science에 소개되었있습니다. Facebook에는 특정 인물에 대한 키워드를 분석 하고 점수화 해서 Facebook유저와 특정 인물간에 관계를 분석하는 알고리즘이 있습니다.
(예시 : 복잡계 네트워크 분석 모식도 출처 위키피디아)
예를 들어, Facebook 댓글에 특정 인물을 자주 언급한다던지, 리스팀과 같은 것을 자주한다 혹은 특정 인물에 대한 글에서 우호적인 단어들이 많이 발견될 경우 높은 점수를 부과해서 특정인물의 글에 대한 노출도를 높여주거나 반대로 그다지 친하지 않다고 판단될 경우 특정인물에 대한 노출도를 줄여준다던지 하는 알고리즘인데, 이를 이용하여 연구자는 그 당시 아일랜드에 쓰여진 전쟁관련 책 "Cogadh Gaedhel re Gallaibh"에서 같은 아일랜드 인이지만 적이었던 상대와 바이킹족에 대해쓰여진 문장에서 우호적인 단어, 중립적인 단어, 적대적인 단어를 각각 연결 시켜서 점수화했습니다.
(Cogadh Gaedhel re Gallaibh, 11세기에 쓰인 아일랜드 통일 전쟁사, 출처 Ardclough Community Council )
그 결과 같은 적이었지만 같은 민족인 아일랜드인에 비해 바이킹에 대한 적대감이 더 강한것을 확인 할 수 있었고 Brain Boru 왕은 실제로 내전 보다는 바이킹에 대한 전쟁을 일으켰을 가능성이 높다고 결론 지었습니다.물론 이러한 연구는 쓰여진 책 자체가 정치적 목적에 의해서 변질되었을 가능성이 있음을 연구자도 인정하지만, 너무 실제 상황과 동떨어지게 묘사를 할 경우 대중의 설득력을 얻지 못하므로 크게 변조를 하지는 못했을 것이라고 조심스레 추측하고 있습니다.
현재 실제 역사기록물들은 고대의 언어로 쓰여져 있어서 해석이 어렵고 또 그 양이 방대해서 기록물들을 모두 읽고 종합적 판단을 내려서 역사적 사실을 밝혀내기보다는 이렇게 각 키워드에 대한 연결 구조를 분석하여 정보를 얻어내는 데이터마이닝방식을 채택하고 있는 추세라고 합니다.
그래서 드는 생각인데, 만약 이러한 연구를 현재 우리나라 역사에도 도입해 보면 어떨까 하는 생각이 듭니다. 현재 조선왕조실록 편찬에 쓰인 각종 사료들의 양이 너무나도 방대해서 아직까지 독해가 마무리되지 않았다고 하는데요. 평서체의 형태로 기록된 사초들을 데이터베이스화 해 놓고 각 정치적 인물에 대한 역사에 새로운 시각을 제공해 줄수 있지 않을까요?
오늘 글은 여기까지 입니다~
감사합니다.
재미있게 잘 읽고갑니다!! 진짜 딱 제 스타일의 글이에요. 저만을 위한 난이도 같습니다. 대학에서 배우는 기본적인 과학지식만 있다면 무난히 이해할 수 있는 그런 글요. 목적에 맞게 잘 쓰신 것 같습니다. 너무 어렵지도 않고 너무 쉽지도 않은... 사실 스티밋의 kr-science들어가서 보면 전문가님들 글 읽다보면 주눅이 들때가 많거든요. 한국말도 이해가 안되서 말이죠. 헤헤 앞으로 좋은 글들 더 부탁드려용~!! 저번글에서는 예술과 재료에 대해서 논의하시더니 이번에는 데이터마이닝이네요? 확실히 박사과정에 있으면 다방면으로 알아야하는가 봅니다...
감사합니다 ㅎㅎ다방면으로 안다기보다는 전공공부가 너무 재미없어질때 마다 조금씩 다른걸 공부하다보니 그런거같네용 ㅋㅋ;;; 그리고 친구가 데이터마이닝쪽 분야를 하다보니 가끔 얻어 듣습니다 ㅎㅎ 다음번에도 더 좋은 글로 찾아뵐수 있도록 할게요~
재미있는 소개 감사합니다. 과학을 일반인들에게 소개시킴에 있어서 이러한 글들이 활성화되어야 한다고 생각합니다.
아참, 여담이지만, 조선왕족실록에 대한 통계적 분석은 현재진행형이긴 합니다. 참고로 알려드려요 :)
앗 감사합니다! 역시 이미 우리나라에서도 쓰이던 분석법이군요 ㅎㅎ
덕분에 제 글이 좀더 풍성해졌네요~ 감사합니다!