Pułapka Bayesa

in #polish7 years ago (edited)

Załóżmy, że na Steem istnieje inteligentny bot bazujący na sieciach neuronowych, którego zadaniem jest flagowanie postów, naruszających ogólnie przyjęte zasady. Niech taki post trafia się 1 na 1000. Bot jest dość skuteczny, myli się tylko w 1% przypadków. Od decyzji bota można się odwołać, wtedy kilku użytkowników o wysokiej reputacji ręcznie analizuje sytuację i w razie potrzeby cofa flagę.

Pewien nowo zarejestrowany użytkownik dodaje swojego pierwszego posta, jednak po chwili zauważa, że post ten został doszczętnie zakopany. Była to flaga własnie od tego bota. Użytkownik obraża się na platformę i postanawia nigdy więcej już tutaj nie zawitać. Czy jego decyzja była słuszna? Okazuje się, że prawdopodobieństwo, że flaga była zasłużona wynosi tylko około 9%.

Można to obliczyć na podstawie wzoru:
P(H|E) = (P(E|H) * P(H)) / P(E)
gdzie:
H - hipoteza (hypothesis)
E - zdarzenie, dowód (evidence)
P(H) - prawdopodobieństwo hipotezy H
P(E) - suma prawdopodobieństw zdarzenia E
P(H|E) - prawdopodobieństwo, że hipoteza H jest prawdziwa, jeśli wystąpiło zdarzenie E
P(E|H) - prawdopodobieństwo zdarzenia E, jeśli hipoteza H jest prawdziwa

Po podstawieniu:
P(H|E) = (0.99 * 0.001) / (0.99 * 0.001 + 0.01 * 0.999) ~= 0.09 ~= 9%

image.png

Obrazowo, skuteczność bota to 1%, więc na 1000 postów 10 zostanie oznaczonych flagą bezpodstawnie, a jeden post faktycznie na tę flagę zasłużył. Z czego wynika, że prawdopodobieństwo tego, że oflagowany post posiada zasłużoną flagę to 1/11 = 0.09.

Ciekawostka - jeśli istniałby drugi bot, oceniający w niezależny sposób (na innej zasadzie), ale z taką samą skutecznością i również zaklasyfikowałby dany post do oflagowania to wtedy prawdopodobieństwa, że ta flaga była słuszna wynosi już 93%.

Przykład zainspirowany poniższym filmem:

Sort:  

@jacekw w sieciach neuronowych? Jak?

Sztuczne sieci neuronowe pozwalają na rozwiązywanie wielu problemów. Są matematycznym odpowiednikiem biologicznych sieci neuronowych występujących w organizmach żywych. Jednym z takich problemów jest wykrywanie spamu czy tego typu zachowań.

Dzięki za wyjaśnienie. Już myślałam, że coś się komuś wszczepia, jakiegoś czipa z botem.... się wystraszyłam :P

Cześć! Redakcja Tygodnika Kuratorskiego jest pod wrażeniem Twojej twórczości i chcemy prosić Cię o zgodę na publikację opisów oraz linków do Twoich postów w przyszłych numerach. Zależy nam na promocji wartościowych treści poprzez tworzenie cotygodniowego artykułu zbiorczego. Więcej możesz przeczytać tutaj: Tygodnik Kuratorski #0

Ok, zgadzam się :)

Awesome, Upvoted, follow and resteem

Akurat mam z tego kolokwium. :D

Po przeczytaniu Twojego postu, ogarnęło mnie lekkie przerażenie.
Od końca moich studiów minęło wcale nie tak dużo lat. a o twierdzenie Bayesa musiałem sobie praktycznie przypominać od zera. Obecnie zamiast takich fajnych informacji mam głowę pełną nie praktycznej wiedzy o różnych frameworkach do programowania :(

@jacekw dobrze, że w dzisiejszym czasie, gdy prawie wszystko opiera się na matematyce są osoby tłumaczące te zagadnienia. Jak widzi się w praktyczny sposób wykorzystanie wiedzy, to chętniej się ją pogłębia.

Coin Marketplace

STEEM 0.19
TRX 0.15
JST 0.029
BTC 63501.83
ETH 2650.23
USDT 1.00
SBD 2.81