You are viewing a single comment's thread from:

RE: [뉴비존 x 프로미스팀] why BIG DATA. 1st

in #promisteem6 years ago

대충 제가 하고 있는 것을 기록해 보면

간단하게 보면 대략 4단계로 (수집 => 분류 => 분석 => 보고) 처리되지만


  1. 일단 데이터 수집을 위한 : 크롤러 ( 일반적으로 sns 나 신문기사 정보를 수집 )

  2. 자연어 분석 : 수집된 데이터를 자연어 분석하여 유형별로 분류

  3. 도메인 전문가 : 업무 특성을 잘 알고 수집된 데이터를 분석할 줄 아는 사람이 분류된 데이터를 어떻게 후처리하라고 지시

  4. 보고를 위해 데이터를 도메인 전문가가 이야기 해준 로직을 적용


결론 쉽지 않고 힘들며 또한 지속적으로 트랜드에 따라 변화함. 그리고 이것이 왜 유의미한 결론인가를 고객에게 설득해야 되는데 그건 더 빡셈 ㅎㅎ

그리고 tensorflow, hadoop, mongodb, bigquery, R, python, nodejs, 형태소분석, wordtovec, NLU, ML(machine learning), MC(machine comperhension) 등 개발언어와 관련지식 또한 복합적으로 알고 있어야 소통이 가능해서 빡친 업종이라 할 수 있겠습니다.

Sort:  

역시 운사마형님+_+ 존경스!!

다양한 개발언어와 관련지식을 아는 것두 중요하지만 제일 중요한건 분석을 통한 인사이트를 내는 능력이라고 봐요. 지식은 그저 소통을 위한 부분이고 데이터 사이언스 스스로가 내공이 있다면 그 모든게 인사이트 하나로 커버가 되지 않을까 싶긴합니다. 다만 이런 상황이 오기까진 부단한 노오력이 필요하긴 하더라구요 ㅎㅎㅎㅎ 신뢰도가 쌓여야해소요 ㅋ

Coin Marketplace

STEEM 0.21
TRX 0.20
JST 0.034
BTC 90504.92
ETH 3101.91
USDT 1.00
SBD 2.98