[씨세론이야기] 번역 데이터 활용의 두번째 단계, 번역 보조도구 마이캣툴 MYCATTool

in #kr-newbie6 years ago (edited)

ciceronmain.jpg

안녕하세요 언어 경계없는 커뮤니케이션을 돕는 @ciceron 입니다.
지금까지 꽤나 많은 글들을 올리며 씨세론의 이야기를 들려 드린것 같네요. 아무래도 일주일에 한번, 이주일에 한번 저희의 이야기를 올리다 보니 아직 “씨세론의 정체가 뭐야?” 라며 감이 안잡히는 분들도 계실 것 같아요..ㅎㅎ 저의 부족함 탓입니다 흑흑..

[가입인사] 하나 된 스티밋 만들기! 씨세론 스티밋 계정 입니다.
[씨세론이야기] 소통을 위한 번역, 씨세론이 합니다
[씨세론이야기] 번역 데이터 활용의 첫단계, 기계 번역기 MARO를 소개합니다.
[씨세론이야기] 기계 번역기, MARO 보고싶은사람 여기여기 모여라!
[씨세론이야기] 씨세론 번역기 마로의 데이터 학습법 최초공개!!

지금까지의 올린 씨세론의 이야기들 인데요~
간추려 이야기를 하자면, 씨세론은 전문 번역 서비스를 통해 고품질 번역 데이터를 수집하고 그 데이터를 효율적으로 관리하여 번역가 그리고 사용자에게 도움이 될 수 있는 데이터의 활용 방법을 만들어가고 있습니다. 그 첫번째 단계가 바로 기계 번역기 MARO 이며, MARO는 번역의 생산성과 품질 그리고 일관성을 유지할 수 있는 방법으로 활용될 것입니다. 그리고 오늘은 바로 데이터 학습과 활용의 두번째 열쇠를 공개하고자 합니다.


번역 데이터 활용의 두번째 열쇠, 마이캣툴 (MYCATTool)


마이캣툴은 번역가가 클라이언트와 함께 번역 프로젝트를 공유하고, 각자의 번역 데이터를 관리 가능하며 실제 번역에 다시 활용할 수 있는 번역 보조 도구입니다. 기계 번역기 마로도 내장(?) 되어 있어 번역을 하는 도중에 마로의 도움도 빠르게 받을 수 있죠! 그 모습을 한번 보실래요??

캣툴예시.jpg 마이캣툴의 모습입니다. 나중에 기회가 된다면 마이캣툴의 자세한 사용방법도 소개하도록 할게요 :)

사실, 대부분의 전문 번역가들은 이미 CAT Tool을 사용하며 자신의 단어장과 번역물을 관리하고 있습니다. 하지만 씨세론은 기존 캣툴에 번역가, 클라이언트, 프로젝트 담당자 모두가 번역 데이터를 관리하고 활용할 수 있는 마이캣툴을 만들게 되었습니다.

마이캣툴이 데이터 활용에 중요한 열쇠가 되는 이유는 1:1 대응 고품질 번역 데이터 저장이 가능하다는 점 입니다. 바로 전 씨세론 이야기에서 고품질 1:1 대응 데이터의 중요성에 대해 이미 설명드렸는데요. 전문 번역가들이 마이캣툴을 통해 작업을 함으로써,버려지는 데이터 없이 MARO를 학습시켜 다른 번역 작업에 데이터를 기여하거나 활용할 수 있게됩니다.


마로와 마이캣툴의 상호보완성


마이캣툴에 마로가 붙어있는걸 보고 눈치 채셨을지 모르겠지만, 데이터 활용의 열쇠로 소개한 기계번역기 MARO와 번역 보조도구 MYCATTool 은 상호 보완적인 상생의 관계입니다. 어떻게 상생의 관계냐구요?? 말이 어렵지 정말 간단하답니다. ㅎㅎ쉽게 설명 드릴게요 :)

  • 마이캣툴을 통해 번역된 1:1 대응의 고품질 번역데이터는 번역기 MARO 를 학습시킵니다.
  • 좋은 데이터를 통해 똑똑해진 번역기 MARO는 마이캣툴에서 번역가의 작업을 돕습니다.

간단하죠~? 마이캣툴에 쌓이는 번역 데이터를 통해 점차적으로 번역가의 수고를 덜어주는것이 번역데이터 활용의 두 열쇠, MARO번역기와 MYCATTool의 역할입니다.


캣툴 자체가 낯선 분들이 훨씬 더 많을것 같습니다:>
다음에는 마이캣툴 사용법에 대해서 설명드릴게요!
안뇨옹~

Sort:  

궁금한점이 있습니다. '전문 번역인'이 입력하여 학습되는 번역 작업이 그닥 '전문적'이지 않을수도 있을텐데, 그런 경우에는 기계학습도 잘못된 방향으로 흐르게 되지 않을까요?

안녕하세요. 답변이 늦었습니다.

질문 해주신 번역문의 수준은 학습에 상당한 영향을 주는 요소입니다. 때문에 학습 전 데이터를 신뢰있는 데이터로 기계 혹은 사람이 처리하는 과정을 거치기도 합니다. 하지만 시간과 비용의 측면에서 일정 부분 불리함을 감안하고 학습을 하여 모델을 만들기도 합니다.

이를 해결하기 위해서 유료번역 혹은 사람들이 검증한 부분 등을 데이터 확보 방법등 데이터 취득의 단계에 데이터 신뢰부분을 포함하여 데이터를 확보하는 방안을 연구 개발을 완료하였습니다.

@youngseonyoon님이 의뢰하신 번역 견적서입니다

의뢰시간언어금액거래번호
2018-4-5KO > EN14.92 STEEMae0eddb8519c71672452d3bc88611116

Powered by Steemit Translation by CICERON

  • 최초 공급가액에는 번역 및 초벌감수까지 포함되어 있습니다.
  • 번역물 제공 후 과하지 않은 선에서 추가 문의 및 검수 요청은 가능합니다.

Coin Marketplace

STEEM 0.30
TRX 0.12
JST 0.034
BTC 64136.70
ETH 3128.20
USDT 1.00
SBD 3.94