[투자의 단상/250901] 애널리스트 심리 대전#8

팔방미인 FinBERT

FinBERT 의 가장 대표적이고 널리 활용되는 기능은 금융 텍스트에 대한 심리 분석(Sentiment Analysis)이다. 이는 문장, 뉴스 헤드라인, 보고서 등의 막대한 텍스트가 긍정적(positive), 부정적(negative), 또는 중립적(neutral)인 어조를 가지는지 분류하는 작업

FinBERT 모델은 이러한 심리를 정량화하는 데 강력한 도구로 활용될 수 있다. 특정 기업이나 주식 티커와 관련된 금융 뉴스 헤드라인, 전체 뉴스 기사, 또는 트위터와 같은 소셜 미디어 게시물의 긍정/부정/중립 심리를 분류하는데 사용되며 이렇게 추출된 정보는 다양한 투자 전략에 통합될 수 있음

이러한 모델은 투자전략/포트폴리오 구성/거시경제예측 뿐만 아니라 리스크 관리 및 예측/금융사기 탐지/고객서비스 및 상품 추천 등에 적극 활용될 여지가 있는 것 같습니다.

FinBERT 분석: Alphabet 2Q 어닝콜

알파벳(GOOGL)의 2 분기 어닝 콜은 ‘선제적 리스크 관리 후 자신감 회복’으로 요약
이번 컨퍼런스 콜의 이례적인 점은 통상적으로 경영진의 사전발언(-0.044)보다 질의응답(Q&A) 세션의 심리 점수(+0.236)가 높게 나타났다는 점이다. 이는 경영진이 사전 발언에서 대규모 자본 지출(Capex) 증가와 법률 비용 등 잠재적 악재를 선제적으로 공개하여 시장의 우려를 언급한 후, Q&A 세션에서 이러한 투자의 당위성과 미래 성장성을 성공적으로 설득했음을 의미

알파벳 컨퍼런스콜의 사례를 살펴보면 기존의 구술된 애널리스트 평가 내용을 보던 것에서 나아가 사전발언/질의응답 단계별로 구체적인 수치로 Sentiment를 나타내게 되어 보다 명확하게 어닝콜이 주가에 미치는 영향을 파악할 수 있다는 장점이 있는 것 같습니다.

발언자의 역할별 심리 분석도 위와 유사한 결과를 나타냈다.
경영진 (Executive): -0.053 (중립/소폭 부정)
애널리스트 (Analyst): +0.679 (긍정적)
애널리스트들이 제기한 우려 사항들이 경영진의 답변을 통해 상당 부분 해소되었음을 시사
주제(Topic)별 심리 분석을 보면 클라우드, 유튜브, 구독 비즈니스는 긍정적인 심리 점수를 나타냈으나 검색의 진화, 인프라 투자와 비용 등은 부정적인 점수를 나타냈다.


KR-FinBERT

KR-FinBERT는 한국어 NLP 모델인 KR-BERT-MEDIUM 을 기반으로, 금융 도메인에 특화된 데이터를 활용해 사전 학습과 미세 조정을 진행한 모델이다. 금융 분야의 전문 언어와 맥락을 효과적으로 처리하기 위해 설계되었으며, 특히 감성 분석(긍정/중립/부정)과 같은 금융 관련 NLP 작업에 최적화

72 개 미디어 소스(예: 파이낸셜 타임즈, 한국경제 등)에서 수집한 440,067 개의 기업 관련 경제 뉴스 기사 및 제목과 16 개 증권사(예: 키움증권, 삼성증권 등)에서 제공한 11,237 개의 애널리스트 리포트의 금융 도메인 데이터를 사용

애널리스트 보고서의 텍스트를 분석하여 기업 전망, 리스크 또는 추천 의견(매수/중립/매도)을 추출하는데 활용
기업의 부정적인 재무 상황이나 규제 이슈를 감시하는 목적으로 KR-FinBERT 를 통해 기업 관련 뉴스나 공시 자료를 분석하여 부정적 신호를 사전적으로 파악하는 것이 가능

태영건설이나 롯데케미칼 사례를 보면 확실히 부정적 이벤트 사전/후에 부정적 뉴스나 부정의견이 많은 것을 확인해 볼 수 있습니다.

내일은 삼성전자 vs 하이닉스 사례를 통해 퀀트투자의 가능성을 확인해 보도록 하겠습니다.

Sort:  

@seraphim502, this is a fascinating dive into the world of FinBERT and KR-FinBERT! I'm particularly impressed by how you've broken down the application of sentiment analysis in understanding earnings calls and predicting potential risks, as demonstrated with the Alphabet and 태영건설/롯데케미칼 examples.

The ability to quantify sentiment from different speakers and topics within a single earnings call is a game-changer! I'm curious to see how this technology evolves and integrates into mainstream investment strategies.

Your analysis clearly demonstrates the potential of these models in risk management, fraud detection, and even customer service. I am looking forward to the 삼성전자 vs 하이닉스 analysis! Thanks for sharing this insightful and valuable information with the Steemit community!

Congratulations, your post has been upvoted by @nixiee with a 45.58740786385066 % upvote Vote may not be displayed on Steemit due to the current Steemit API issue, but there is a normal upvote record in the blockchain data, so don't worry.

Coin Marketplace

STEEM 0.13
TRX 0.34
JST 0.035
BTC 110710.32
ETH 4315.89
SBD 0.84