보상 어뷰징을 판별할 수 있는 기준들
(연구에 가까운 글이라 문체가 다소 딱딱할 수 있습니다. 양해 바랍니다. 경어와 존칭은 생략합니다.)
@oldstone은 그의 포스팅 (셀프보팅과 담합보팅 해결책) 기준을 정하기에서 어뷰징을 판별하는 기준을 정하는 것이 불완전하고 악용될 수 있는 인간의 행동을 최소화하고 보다 빠른 합의를 이끄는 길이라고 주장하였다. 필자 역시 그의 주장에 동의하는 바이다. @oldstone은 이어서 스팀파워 보유량에 따른 셀프보팅 비율을 기준으로 삼자고 제안한다. 얼핏 보면 문제해결을 위한 단순하면서도 명료한 방안 같지만 이는 보상을 더 쉽게 더 많이 가져가겠다는 인간의 동기와 그것이 표출되는 복잡한 행동양상을 “셀프보팅”이라는 하나의 행위로 환원한다는 문제가 있다. 즉, 셀프보팅이 아니어도 어뷰징이 가능한 방법이 충분히 존재하며, 이미 이러한 방법들은 도처에서 이루어지고 있다. 만약 셀프보팅만을 기준으로 삼는다면 도리어 어뷰저들에게 면죄부를 주는 결과를 야기할 것이다.
오랜 기간 어뷰저로 인식되어온 계정들의 패턴을 지켜본 결과 필자는 몇 가지 공통적인 사항을 발견하였다. 이 포스팅에서는 그 수치화된 요소들에 대해 검토하고 향후 어뷰징 기준을 세워가는 논의에 디딤돌이 되는 것을 목표로 한다.
1. 셀프보팅
많은 사람들이 얘기했듯이 셀프보팅은 어뷰징 중 가장 명확한 요소이다. 하지만 셀프보팅은 그 자체로 나쁜 것이 아니며 중요한 것은 셀프보팅이 전체 보팅에서 몇 프로나 차지하고 있는지가 중요하다. 높은 비율의 셀프보팅은 타 구성원의 기여를 인정하지 않는다는 의미를 내포하고, 이는 상호작용과 상호평가가 필수적인 커뮤니티의 발전을 저해하기 때문이다. 물론 그 적정 비율에는 논쟁의 여지가 있지만 50% 이상의 셀프보팅에 대해 문제삼는 것에는 이견이 없는 듯하다.
2. Inverse Simpson Index
Inverse Simpson(IS) 지표는 Simpson Index의 역수를 취한 것으로 얼마나 “다양한” 사람에게 보팅을 얼마나 “분배”했는지를 나타내는 지표이다. 이 값이 높을수록 많은 사람에게 공평하게 보팅을 했다는 것이다. 물론 이 값이 무조건 높은 것이 늘 좋지는 않다. 그런 경우는 기계적인 보팅일 경우도 있고, 완벽하게 공평한 보팅은 컨텐츠 필터링에 유익하지도 않다.
이해를 돕기 위해 보팅패턴에 따라 IS지표가 어떻게 변화하는지 살펴보도록 하자.
필자의 경험으로 IS지표는 단기간으로 보면 활용도가 떨어진다. 하지만 30일 이상 장기간을 놓고 봤을 때에는 어뷰저와 일반 사용자 간에 큰 차이를 보이는데 그 이유는 전체 커뮤니티에 대한 열린 보팅을 하고 있는 일반 사용자는 기간이 길어질수록 불특정 다수의 포스팅에 대한 보팅비율이 늘어나기 때문이다. 반면에 특정인만을 대상으로 하고 있는 어뷰저들은 IS지표가 30
이하로 낮은 경우가 많다.
3. Inverse Simpson 지표의 변화
IS지표는 정적인 상태로도 의미를 갖지만 동적인 시각에서 바라볼 때에도 흥미로운 사실을 나타낸다. 어떤 어뷰저들은 IS지표가 높기도 했지만 지표산정 기간을 단기에서 장기로 바꿨을 때 IS값 변화율이 크지 않았다. 반면에 일반 사용자들은 기간이 늘어날수록 IS지표가 증가하는 경향을 보였다. 먼저 일반적인 패턴을 보자. 첫번째 그래프는 7일기준, 두번째 그래프는 30일 기준이다.
극적인 변화는 없지만 상위 보팅의 파이가 조금씩 줄어들고 하위 파이 모음이 증가한 것을 볼 수 있다. 이것의 의미하는 바 역시 앞에서 언급한 것과 동일하게 열린 보팅을 하고 있기 때문이다. 단기적으로는 닫힌 보팅인 것 같아보여도 장기적으로 보면 보다 많은 사람들에게 보팅을 하고 있다는 것이다.
반면에 아래 두 계정(각각 7일, 30일 그래프)을 보면 IS지표값이 거의 차이가 없음을 알 수 있다.
계정1
계정2
4. 일평균 보팅 수
어뷰저는 최대의 수익을 목표로 하기 때문에 대부분의 어뷰저는 1일 10회 풀보팅을 목표로 한다. 하지만 어뷰저가 아닌 사람도 1일 10회의 풀보팅을 목표로 하는 경우가 있다. 이 때 평균 보팅 수는 IS지표의 단점을 보완하는 측면에서 사용될 수 있다. 즉, 보팅을 활발하게 하지 않는 사람의 경우 IS지표가 매우 낮게 나오는데 (기간 내에 1번만 보팅하면 IS지표는 1이다) 이 점에 착안하여 IS지표가 낮더라도 일평균 보팅 수가 적은 계정은 어뷰저로 간주하지 않는 것이다.
5. 상위 보팅계정간의 연관관계
많은 어뷰저들은 상호보팅 관계에 있고, 이를 통해 “셀프보팅”이라는 관문을 쉽게 통과한다. 하지만 이들의 보팅 목록을 보면 상위 10위 정도까지 비슷한 이름이 반복됨을 알 수 있다. 구체적인 부분에 대해서는 더 연구가 필요하겠지만, 상위 10~20개 정도의 보팅 계정 목록을 토대로 네트워크 분석을 한다면 유의미한 군집이 나올 수 있고, 그들간의 담합보팅 비율을 확인할 수 있을 것이다. 참고로 예전에 스팀헬퍼스 문제가 불거졌을 때 필자가 조사한 바로는 10개 계정의 상보보팅 비중이 50~80% 가량이었다.
나가며
어뷰징이 날마다 발전하듯이 어뷰징 기준도 날마다 발전해야 한다. 이는 모든 법과 기준에도 동일한 것이다 (암호화폐가 존재하기에 관련 제도도 생겨나야 하듯이). 이 짧은 연구가 어뷰징에 대한 기준을 세우고 커뮤니티의 공감대를 형성하는데 도움이 되길 소망한다.
숫자로 보면 명확하군요.
블록체인이 참 좋습니다.
이렇게 조사하면 다 나오니까요.
이런게 없었다면 아마 가훈은 정직을 외치면서도
뒤로는 해 먹는 무리들이 판을 쳤겠지요.
이번에도 이명박이 유출 문서가 없었다면 증거가 없었을 거라고 하니...
빨리 모든 분야에 블록체인이 널리 쓰이길 바랍니다.
이렇듯 세세하게 분석해 볼 수 있군요.
어떤 합의가 잘되어야 할텐데, 뮤트를 하고 풀지 않으신 분이 있어서 안타깝습니다.
올해 중순 즈음에 SNS네트워크 분석을 스팀에 이용해보려고 합니다. 물론 계정명은 가린 상태로 진행하겠지만...혹 제가 정보력이 약해서 그러는데 스팀 네트워크 분석 사례가 있나요?
제가 예전에 한게 하나 있습니다.
https://steemit.com/stats/@clayop/the-typology-of-curation-what-kinds-of-curators-we-have-now
감사합니다. 잘 참고해서 도식화까지 진행해보겠습니다.
수치로 표현하니 이해가 빠르네요.
좋은 의견 잘 듣고 갑니다.
셀프보팅에 대한 어느 정도의 제한을 적용하는 것도 좋은 방법이 아닐까 싶습니다.
That's good of you....Cheers @clayop (>‿◠)✌
고생많으셨습니다. 정독하는데 꽤나 걸렸네요. 잘 모르는 말들이라 제가 직접 말하긴 그렇지만 IS 지표라는 것으로, 공평하게 많은 사람들에게 보팅을 했다는 판단을 할 수 있었으면 좋겠습니다. 짧은 연구 잘 읽고 갑니다. 지식도 글도 많이 배워갑니다.
셀봇을 9번을 풀봇하고, 나머지 한번할 양을 1%씩 나눠서 100명에게 보팅하면 vote diversity 차트에 어떤 영향이 있을까요?
미미합니다. 기준이 횟수가 아니라 비율이기 때문이죠.
단순 횟수만이 아니라 파워로도 뽑을 수 있을 걸로 압니다.
https://www.steemus.com/UserList.jsp
여기 보면 보팅 챠트에서 파워로 보는게 있지요.
그 파워로 뽑으면 알 수 있지 않을까요?
정확하겐 rshares로 뽑을 수 있습니다
정리 감사드립니다
어뷰저스가 많아짐에 따라서 스팀잇의 위기가 왔다는 걸 실감하게 되네요....
원래 많았는데 그간 모르고, 혹은 알고도 모른 척 한 건 아닌가 싶기도 합니다.