이번달 세미나 대략 요약steemCreated with Sketch.

in #kr-study3 years ago (edited)

이번달 금융 세미나의 주제는 매우 흥미로웠다. text 에 대한 내용이 주를 이루었다.

1 . 자연어 분석을 통해 기사-> 주가에 대한 분석

기존에는 단어에 positive/negative 값들을 미리 부여한 (predefined) 된 형태였다면 오늘 발표한 논문에서는 suprevised 알고리즘으로 (사전에 단어에 positive/negative 의미를 주지 않고 학습을 시켜서 알아서 positive/negative sentiment 를 하게끔 ) 상당히 신박했다.

자연어 처리나 ML 을 잘 알지 못하지만, 이 SESTM(Supervised Extraction Algorithm) 의 기본 원리는 간단하게 보이는데 어떻게 구현하는지는 잘 모르겠다. 발표자의 말에 따르면 주식 시장에서 꽤 성능이 높아서 (Sharpe ratio 가 4.29) 미국의 헷지펀드에서 향후 4-5년은이걸 잘 구현해서 돈을 벌고 있다고 한다.

WOW 분석 논문에는 Fama French 3factor를 비교해도 새로운 factor 가 보인다고도 하고 stock 에서는 확실히 잘 먹혔다고 하는데 이런걸 cryptocurrency market 에서 잘 먹힐까? 일단 이런 것을 제대로 보려면 기사의 공신력이 중요할 것 같은데 흠... 코인 텔레그래프나 코인데스크, 등 코인 뉴스 관련해서 꽤나 공신력 있는 저널들이 있다고 하는데 ㅋㅋㅋㅋㅋㅋ

자연어 분석 전문가가 두명 정도 있는데 그 친구는 이번 세미나에 안 들어왔네

2 . 트위터, 온체인 데이터 등등 자료 수집 방식

크롤링// 트위터나 구글에서 오래된 정보는 돈을 주고 파는데 생각보다 가격이 비싸서 회사 단위에서는 필요에 의하면 과거 데이터를 사기도 하지만 그 외에 현재 데이터는 크롤링을 통해 수집 한다고 한다.

3 . ML algorithm 이야기가 좀 나왔는데 갑자기 여기서 인간 본성 이야기로 넘어가네? 흠 ㅋㅋㅋㅋ 신기하군

후반부는 따라가기가 힘들었다 ㅋㅋㅋ

Coin Marketplace

STEEM 0.18
TRX 0.14
JST 0.029
BTC 57020.43
ETH 3081.72
USDT 1.00
SBD 2.41