스팀잇 이상탐지 보고서(v2.0)-오전(UTC) (2017-10-05 ~ 2017-10-05 12:00:00)
본 보고서는 공개되어있는 데이터를 활용하여 스팀잇내에서 의심되는 행동(Suspicious Behaviour)을 하는 유저들을 잡아냅니다. 스팀잇 구조상 글 작성자와 구독자는 보팅을 통해 보상을 받게 됩니다. 글 작성자에게는 글 작성에 대한 노력에 대한 보상으로 author rewards를 그리고 보팅을 한 유저에게는 curation rewards을 받게 되는데요, 현제 스팀잇은 글(article)이나 댓글(comment)를에 대해 보팅을 할 수 있게 되어있습니다. 여기서 자신이 작성한 글/댓글에 보팅을 통한 보상도 가능 한데요. 물론 이것이 나쁘다는건 아닙니다. 최소한 자신이 공들여 작성한 글에 최소한에 보상을 받을 수 있으니까요. 하지만 이 시스템을 악용하는 사례들도 있습니다.
저는 Block-Chain 기술의 가장 큰 장점이 모든 거래정보를 공개하는 것에 있다고 보는데요. Black-chain 기술 기반으로 만들어진 스팀잇내에서는 유저의 모든행동, 글/댓글 작성 및 보팅 내역 포함이 모두 공개 되어 있습니다. 하지만 모든 사람이 스팀잇이 제공하는 정보를 쉽게 접근 할 수는 없는데요. 이 보고서의 취지는 스팀잇에서 공개하는 데이터를 될 수 있으면 모든사람들이 쉽게 받아들일 수 있는 형태로 가공/전달 하는데에 있습니다.
현재로선 유저의 실제 아이디명은 공개 하지 않겠습니다. 다만 Block-chain 기술은 당신의 모든 행동을 정보화 하면 공개되어있다는 사실을 아셨으면 합니다.
데이터 기간 (2017-10-05 ~ 2017-10-05 12:00:00)
-총 데이터 수: 8219
-기간내의 총 스팀잇 유저수: 3572
Self-Voting (SV)
상단에 위치한 그래프는 2017-10-05 ~ 2017-10-05 12:00:00 동안 자신의 글/댓글에 보팅을(=SV)하신 SV수-유저수를 보여줍니다.
총 3572 SV 유저 분석결과 평균 SV수는 2.3 ,최대 SV수는 82 그리고 분포는 3.5 로 나타났습니다 (상단 그래프).
2017-10-05 ~ 2017-10-05 12:00:00 동안 자신의 글/댓글에 보팅을 한 Top 10:
Self-Voting 탑 10 유저의 7일 동안의 보팅 패턴
위 네트워크는 (2017-09-28 ~ 2017-10-05 12:00:00)기간 동안 SV유저(빨강색)들의 보팅 패턴을 통한 다른 유저들과의 관계를 보여줍니다.
Self-Voting 1위~5위
Self-Voting 6위~10위
상단에 위치한 그래프는 SV 기준 상위 10명에 대한 날짜별 (2017-09-28 ~ 2017-10-05 12:00:00) 동안 총 보팅수(회색), SV수(빨강) 그리고 다른유저에 대한 보팅수(파란색)를 보여줍니다.
High-Self-Voter(H-SV) 스팀잇 유저들의 Suspicious 스코어
H-SV 스팀잇 유저들의 Suspicious 스코어는 다음 특징들을 가지고 추출합니다:
-보팅파워(VP) -- 유저의 보팅별 보팅파워
-보팅수(voting_cnt) -- 기간동안 유저의 총 보팅수
-셀프 보팅수(sv_voting_cnt) -- 기간동안 유저가 자신의 글/댓글의 보팅수
-타유저 보팅수(nsv_voting_cnt) -- 기간동안 유저가 다른 타유저에게 한 보팅수
-타유저수(author) -- 기간동안 유저가 보팅한 타유저수
위 특징들에서 추출된 지표들은 다음과 같습니다:
-평균 셀프 보팅 파워(sv_avg_vp) -- 유저가 자신에게준 평균 보팅파워 (=SV 총 VP합/sv_voting_cnt)
-평균 타유저 보팅 파워(nsv_avg_vp) -- 유저가 타유저가준 평균 보팅파워 (=NSV 총 VP합/nsv_voting_cnt)
-셀프 보팅비율(sv_ratio) -- 유저의 셀프보팅 비율 (=sv_voting_cnt/voting_cnt * 100)
-평균 타유저 보팅수(VPA) -- 타유저가 밭은 평균 보팅수 (=nsv_voting_cnt/author)
보상측정을 위한 가상지표들은 다음과 같습니다 (USD):
-가상 총 자기자신 보상금액(SR - Self Rewards) -- 유저의 보팅보상을 $1로 봤을때의 자신의 총 보상액 (=(1 * sv_avg_vp) * sv_voting_cnt)
-가상 총 타유저 보상금액(NSR - Not Self Rewards) -- 유저의 보팅보상을 $1로 봤을때의 타유저의 총 보상액 (=(1 * nsv_avg_vp) * nsv_voting_cnt)
-평균 타유저 보상금액(RPU) -- 유저의 보팅보상을 $1로 봤을때의 타유저의 평균 보상액 (=NSR/author)
(2017-10-05 ~ 2017-10-05 12:00:00)기간 동안 H-SV 스팀잇 유저들의 보팅 패턴(보팅수(voting_cnt), 셀프 보팅수(sv_voting_cnt), 타유저 보팅수(nsv_voting_cnt), 타유저수(author), 셀프 보팅비율(sv_ratio), 평균 타유저 보팅수(VPA))분포을 보여줍니다.
H-SV 스팀잇 유저중에서 상대적으로 보팅비율(SV_Ratio)이 높은 유저(9~10)들의 보팅 패턴 - 빨강색
H-SV 스팀잇 유저의 보팅 보상을 $1로 계산했을때 자신(빨강색)과 타유저(파랑색) 보상 분포입니다.