Czy ktoś powinien wyłączyć Facebooka i co Brexit ma wspólnego z kampanią wyborczą Trumpa.steemCreated with Sketch.

in #polish7 years ago

Słowem wstępu

Źródło: wikipedia
W komentarzu pod jednym z artykułów, wspomniałem o pewnym dziennikarskim śledztwie. Kiedy na początku tego roku o nim przeczytałem, cała historia niesamowicie mnie zaintrygowała ale i zaniepokoiła. Nikt z kim rozmawiałem na ten temat nigdy o tym nie słyszał. Nie obserwuję jakoś zajadle tzw. mainstreamowych mediów, ale wydaje mi się, że w Polsce pisano o tym bardzo niewiele. Postanowiłem więc spróbować Was zaciekawić tym tematem.

Śledztwo dziennikarskie, o którym chcę napisać dotyczyło w pewnym sensie nas wszystkich - czyli użytkowników internetu, wyborców i klientów, ale także psychologii, mediów społecznościowych oraz możliwych manipulacjach podczas głosowania w sprawie Brexitu i ostatnich wyborów prezydenckich w USA.

Big data

Ale zacznę od chyba jedynej stricte technicznej rzeczy o której będę dzisiaj pisał (i postaram się bardzo krótko). Chodzi o termin Big Data. Być może wszyscy wiecie o co chodzi, termin ten jest teraz na tzw. hype'ie jak to się mówi w polskich korpo-windach i korpo-kuchniach. W największym skrócie Big Data to bardzo świeży kawałek informatyki, który zajmuje się ogromnymi zbiorami danych, które pozornie trudno do czegoś wykorzystać, ale jednak na różne, najczęściej bardzo złożone sposoby można z nich wyciągnąć jakąś pożyteczną wiedzę. Przy czym kiedy piszę, że zbiory te są ogromne, to naprawdę takie są (liczone nawet w petabajtach). A jakie dane mogą być w tych zbiorach? W czasach gdy komputery obecne są w każdej dziedzinie życia i wiele nawet zwykłych urządzeń podłączonych jest do internetu to praktycznie każde. Na przykład dane pomiarowe z CERN (polecam bardzo ciekawy filmik na ten temat) albo dane logowań do BTSów (stacji bazowych czyli anten sieci komórkowych, z którymi nasze telefony komórkowe non-stop się łączą). Albo informacje o tym w jaki sposób klienci poruszają się po sklepach wielkopowierzchniowych - nawet w Polsce zbiera się takie dane. I myślę, że tyle w kwestii przybliżenia tego terminu.

Big Data
Źródło: wikipedia

Psychometria

Teraz z kolei przeskoczymy do psychologii. Nauka ta próbuje między innymi klasyfikować ludzkie osobowości - pamiętacie o modelu wywodzącym się chyba jeszcze ze starożytności: melancholik, flegmatyk, choleryk i sangwinik? Nie sądzę by nadal w psychologii używano tego uproszczonego i nieco nieprecyzyjnego podziału. Ale są jeszcze inne modele, znacznie nowocześniejsze, między innymi model OCEAN. Model ten próbuje określić charakter danego człowieka na podstawie przydzielenia pewnej miary dla każdej z pięciu cech osobowości (tzw. wielkiej piątki):

  1. otwartości na doświadczenia (ang. Openess),
  2. sumienności (ang. Conscientiousness) - jak bardzo potrafisz być skoncentrowany i zdeterminowany, jak bardzo potrzebujesz planowania,
  3. ekstrawersji (ang. Extraversion) - jak chętnie nawiązujesz interakcje międzyludzkie, jak bardzo ich potrzebujesz,
  4. ugodowości (ang. Agreeableness) - w jakim stopniu jesteś skłonny do współpracy a w jakim do rywalizacji,
  5. i neurotyczności (ang. Neuroticism) - jak bardzo podatny jesteś na negatywne emocje.

OCEAN
Źródło: wikipedia

Jak może działać takie wymiarowanie? Moje zapewne bardzo uproszczone wyobrażenie jest następujące - ocenia się daną osobę w skali powiedzmy od 1 do 100 pod kątem każdej z powyższych cech. I przykładowy wynik (literka odpowiada nazwie danej cechy po angielsku, wybaczcie właśnie na żywca wymyślam ten zapis ;-) ):

O:22 + C:78,5 + E:54 + A:41 + N:72.

Takie miary uzyskuje się na podstawie bardzo długiej, szczegółowej ankiety, którą badany musi wypełnić. Ankieta ta oczywiście zawiera masę bardzo osobistych i dla wielu niewygodnych pytań. Część psychologii zajmująca się mierzeniem ludzkiej osobowości nazywa się psychometrią (rzadziej psychografią). Podobno na podstawie takiego zwymiarowania, można bardzo wiele powiedzieć o danym człowieku, a także z dość dużym prawdopodobieństwem przewidywać jego reakcje.

Polski akcent

I tutaj dochodzimy do sylwetki polskiego psychologa Michała Kosińskiego, który w 2008 roku jeszcze jako student z Warszawy trafia na brytyjski uniwersytet Cambridge. Tam wraz z pomocą programistów przenosi ankietę OCEAN do Facebooka. Ankieta oczywiście jest dobrowolna i nikt pewnie się nie spodziewał, że po pewnym czasie wypełni ją kilka milionów osób. Kosiński posiadł nagle zbiór danych jakiego nie miał wtedy żaden instytut psychologii na świecie - bo tradycyjne metody przeprowadzania ankiety były niezwykle żmudne zarówno dla badanych jak i dla badaczy. Ale to dopiero początek. Zapewne nie tylko psychologowie zdają sobie sprawę, że z takimi ankietami jest jednak problem. Ponieważ ludzie mają skłonność do lekkiego oszukiwania w ankietach, które dotyczą bezpośrednio ich osoby. Po prostu chcą wypaść nieco lepiej, najczęściej przed samym sobą. Kosiński zaczął się zastanawiać, czy bazując na obserwacji zachowań użytkowników, których osobowość już miał zwymiarowaną na podstawie tej facebookowej ankiety, będzie w stanie znaleźć inną metodę wymiarowania osobowości. Jest wiele sposobów na obserwowanie danej osoby, czy to w internecie czy też poza nim. Każdy z nas zostawia wiele śladów, czy to udzielając się na portalach społecznościowych, czy to robiąc zakupy na portalach aukcyjnych i sklepach internetowych, czy też w historii płatności kartami kredytowymi i debetowymi. Analizując te ślady można właśnie obserwować zachowania danej osoby. I tu właśnie psychologia zderzyła się z Big Data. Inni członkowie zespołu Kosińskiego zajęli się innymi zbiorami danych (takimi np. jak historia płatności kartami) a Kosiński wziął na warsztat facebookowe lajki.

Facebook

Facebook działał wtedy jeszcze trochę inaczej, Twoje lajki widział każdy, nie można ich było wtedy ukryć przed nieznajomymi. Kosiński zaczął budować model, który próbował przyporządkowywać to co dani użytkownicy lajkowali do cech ich osobowości (wynikającej z ankiety). Powstawały różne korelacje, np. najbardziej oczywiste: osoby o wysokiej ekstrawersji chętniej i częściej lajkują wpisy o imprezach i koncertach a wysokim współczynniku neurotyczności wpisy o teoriach spiskowych czy przepowiedniach końca świata. I mniej oczywiste i głębiej sięgające w osobowość: wielu z mężczyzn lajkujący pewną konkretną markę męskich kosmetyków z wysokim prawdopodobieństwem jest homoseksualnych a wielu spośród tych mężczyzn którzy lubią Wu-Tang Clan są z wysokim prawdopodobieństwem heteroseksualni. Oczywiście takie pojedyncze markery to jeszcze za mało, żeby wyciągać jednoznaczne wnioski, ale jeśli pojawia się ich nagle setki, tysiące czy dziesiątki tysięcy i można je również zestawiać krzyżowo, nagle okazuje się, że powstały w ten sposób model może być nawet doskonalszy od ankiet, bo skala przetworzonych danych w pewnym sensie niweluje przekłamania z ankiet. Dalsze prace jeszcze komplikują model i dają jeszcze ciekawsze wyniki. Po pewnym czasie, Kosiński był w stanie zaprezentować dowody, że:

  • już z 68 polubień można przewidzieć
    • kolor skóry użytkownika (z 95% trafnością),
    • czy jest homoseksualny (z 88% trafnością),
    • czy jest demokratą czy republikaninem (z 85% trafnością).

Następnie Kosiński buduje model pomagający przewidywać jak badany będzie odpowiadał na określone pytania:

  • tylko 10 polubień użytkownika wystarczy by system lepiej przewidywał jego odpowiedzi niż jego koledzy z pracy,
  • tylko 70 polubień użytkownika wystarczy by system lepiej przewidywał jego odpowiedzi niż jego przyjaciel,
  • 150 polubień użytkownika wystarczy by system lepiej przewidywał jego odpowiedzi niż jego rodzice,
  • 300 polubień użytkownika wystarczy by system lepiej przewidywał jego odpowiedzi niż jego partner życiowy.

W pewnym momencie nasz rodak zaczyna dostrzegać oprócz inspirujących możliwości tej metody (takich jak super precyzyjne targetowanie reklam komercyjnych czy wsparcie doradztwa zawodowego i planowania ścieżki kariery) również potencjalne zagrożenia. Bo przecież taki model umożliwi jakimś reżimowych rządom wyszukiwanie ludzi, którzy mogą mieć skłonności do stawiania oporu wobec władzy zanim nawet oni sami na to wpadną. Albo w krajach przestrzegających prawa szariatu identyfikowanie osób o odmiennych orientacjach seksualnych lub ateistów. Od pewnego momentu wszystkie publikacje Kosińskiego zaczynają zawierać również ostrzeżenia o niebezpiecznych zastosowaniach takiego modelu.

Cambridge Analytica

Trzy lata temu Kosiński otrzymał propozycję od firmy SCL – Strategic Communications Laboratories. Za sporą kwotę dla instytutu w którym pracował, miałby wrzucić do swojego systemu dane 10 mln kont należących do amerykańskich użytkowników Facebooka. Okazuje się, że specjalnością tej firmy jest wpływ na wybory. Kosiński odmawia. Dziennikarze śledczy mają dowody na to, że młody adiunkt, przez którego SCL dotarła do Kosińskiego, zapoznał tę firmę z jego modelem, być może nawet go skopiował. Zamieszanie powstałe na uczelni kończy się wyjazdem tego adiunkta do Azji (gdzie zmienia nazwisko). Również Kosiński opuszcza Cambridge i rozpoczyna pracę na uniwersytecie Stanforda w Stanach Zjednoczonych. Po jakimś roku na rynku pojawia się nowa firma Cambridge Analytica (jak się potem okazuje, firma-córka SCL). Ma zajmować się marketingiem politycznym za pomocą mikrotargetingu i metody oceny osobowości OCEAN. Firma zostaje zatrudniona przez jedną z organizacji promujących ideę wyjścia Wielkiej Brytanii z UE przed brytyjskim referendum. Wyniki referendum są wszystkim znane. Następnie Cambridge Analytica wspiera kontrkandydata Donalda Trumpa w wyborach wewnątrzpartyjnych - senatora Cruza. Ten co prawda przegrywa jednak z Trumpem, ale wielu z niedowierzaniem przyjęło niezwykle gwałtowny skok popularności tego kandydata (zwanego człowiekiem znikąd) pod koniec kampanii. Kilka miesięcy później, firma dołącza do pracy nad ostateczną już kampanią wyborczą Donalda Trumpa.

Tutaj prezentacja CEO Cambridge Analytica mówiąca o kampanii Cruza (na końcu wspomina również, że jego firma pracować będzie na rzecz jednego z pozostałych kandydatów). W poniższym filmie, CEO przyznaje również, że jego firma ma zmapowaną osobowość każdego dorosłego Amerykanina.

Mikrotargeting

Czy rzeczywiście model opracowany przez Polaka stosowany wraz z mikromarketingiem może naprawdę skutecznie wpływać na wyborców? Jeśli tak, to w jaki sposób? Artykuł dziennikarzy śledczych, który podlinkuje na końcu podaje kilka przykładów. Zespół PRowy sztabu wyborczego przygotował kilkadziesiąt tysięcy wariantów reklam promujących Trumpa jako kandydata. Reklamy te, były wyświetlane na wallu użytkowników Facebooka, ale z odpowiednim dopasowaniem do ich osobowości. Może się wydawać, że przygotowanie takiej liczby wariantów reklam wymagałoby jakichś niemożliwych nakładów pracy. Tej rzeczywiście, sztabowcy Trumpa mieli dużo, ale najczęściej było tak, że reklamy przeznaczone dla jakiejś sprofilowanej podgrupy różniły się tylko niuansami. Na przykład dwa warianty reklamy (jeszcze z kampanii Cruza) skierowanej do obywateli amerykańskich, uważających swobodny dostęp do broni (druga poprawka) za jedno z najświętszych praw obywatelskich. Ten sam slogan o ochronie praw Amerykanów do broni, to samo nazwisko kandydata, różne tło. Na przykład w wersji przeznaczonej dla osobowości neurotycznych, tłem była dłoń w rękawiczce rozbijająca szkło - oczywiste odwołanie do leków i obaw przed włamaniem czy napaścią dla osób ze z większymi skłonnościami do martwienia się. Natomiast w tle reklamy dla osobowości o wysokim poziomie ekstrawersji przedstawiona była postać mężczyzny zabierającego swojego syna lub wnuka na jego pierwsze polowanie - tu z kolei odwołanie się do roli rodziny u osób o silnie towarzyskich. To nie musiały być i nie były wyłącznie reklamy. Osobom czarnoskórym wklejany był filmik z niefortunną, nieco rasistowską wypowiedzią Hillary Clinton. Z kolei członkom haitańskiej społeczności wklejano link do artykułu o nieprawidłowościach w zarządzaniu pieniędzmi zbieranymi przez Fundacji Clintonów na rzecz pomocy po trzęsieniu ziemi na Haiti. Do grup będących pewnym wsparciem dla przeciwniczki Trumpa, przesyłano materiały, mające zniechęcić do uczestnictwa w wyborach.
Zresztą działania na Facebooku to nie jedyna możliwość wykorzystania tego modelu. W swojej prezentacji CA mówiło o jego używaniu przy zbieraniu funduszy na kampanię. Również tradycyjni w amerykańskich kampaniach pomocnicy (czy też ochotnicy) wyborczy, którzy chodzą od drzwi do drzwi - otrzymali na swoje smartfony specjalną aplikację, która po pierwsze podpowiadała do których drzwi szczególnie warto zapukać, a po drugie dawała wskazówki do tego jak przeprowadzać promującą Trumpa rozmowę.

No i?

Trudno jednoznacznie określić rzeczywisty wpływ działań Cambridge Analytica na wyniki wyborów. Brak informacji o tym, by firma ta opublikowała jakiś raport na ten temat. Przyznała się jednak, że otrzymała około 15mln dolarów za swoje usługi. Kosiński w swoich badaniach nad reklamą korzystającą z jego modelu określił jej skuteczność jako kilkunastokrotnie wyższą niż reklamy tradycyjnej. Oczywiście musimy pamiętać, że to nie była jedyna firma wynajęta przez sztab wyborczy Trumpa w celu wsparcia jego kampanii i to nie były to jedyne metody wpływania na wyborców. Być może w innym wpisie opiszę któryś z pozostałych.

Czy wykorzystywanie w ten sposób mikrotargetingu i psychometrii to złe zastosowanie nauki? Czy jest coś niewłaściwego w tym, że przygotowuje się komunikat przeznaczony do konkretnej osoby? Pierwsze pytanie, które przychodzi do głowy - to zależy od treści komunikatu. Oczywiście niemoralna jest taka treść, która będzie wpływać na osobę dla której jest przeznaczona za pomocą kłamstwa czy manipulacji. Ale z kłamstwem i manipulacją mamy do czynienia również w tradycyjnych metodach docierania do wyborców. To w takim razie czy samo zbieranie informacji o użytkownikach internetu w taki sposób by móc określać ich osobowość i budować strategię przewidywania ich reakcji czy wpływu na ich wybory jest moralny? Moim zdaniem nie. Samo wymiarowanie osobowości człowieka bez jego zgody, ja widzę jako naruszenie jego prywatności. Inna sprawa w jaki sposób dane, na podstawie których wymiarowanie zostanie przeprowadzone, są zbierane. Każdy z nas zostawia niezliczoną liczbę śladów zarówno w internecie jak i w realnym życiu. Niezależnie jednak od tego czy dane te są zbierane w sposób całkowicie legalny (lajki na Facebooku - teraz za zgodą użytkownika) czy mniej legalny (fingerprinting przeglądarki i analiza odwiedzanych stron) sposób ich wykorzystania to zupełnie inna sprawa.

A czy próby wpływania na ludzi, z wykorzystaniem ich lęków i obaw, ich niezadowolenia, miłości do rodziny czy jakichkolwiek innych emocji są dopuszczalne? Niestety nie jest to wynalazek współczesnych czasów - demagogia wydaje się być teraz nieodłączną częścią demokracji. A marzenie o demokracji opartej na rywalizacji merytorycznych programów wydaje się już nie tylko utopijne, ale wręcz śmieszne. Tyle, że te metody wywierania wpływu razem z tym przerażającym podejściem, które zamienia osobowość poszczególnych ludzi w bajty jest dla mnie wyjątkowo wstrętne.

Czy rzeczywiście ktoś powinien wyłączyć Facebooka? To niczego nie zmieni, dane są i będą zbierane z innych źródeł. Cóż można zrobić? Na poziomie jednostkowym, dotyczącym jednego człowieka - niewiele. Jeśli nie chce się przyjąć scenariusza od dziś żyję bez internetu lub scenariusza w którym poświęca się 40% swojego czasu na zapewnienie sobie prywatności. Czy są potrzebne są jakieś regulacje? Rządowe czy lepiej międzynarodowe (piszę raczej o EU, bo w np. USA danymi osobowymi i prywatnością obywateli się legalnie handluje)? Temat wydaje się wybitnie trudny do uregulowania. A jeśli powstaną jakieś próby wprowadzenia takich czy innych regulacji, będzie je raczej dość łatwo ominąć. W najgorszym razie takie firmy zejdą do przysłowiowego podziemia. Będą pracować w szarej strefie, w której już właściwie tkwią, jeśli nie jedną nogą, to przynajmniej kawałkiem pięty. Obawiam się, że wkroczyliśmy już na ścieżkę z której nie ma powrotu. Przynajmniej w takim sensie, że nie powinniśmy się zastanawiać jak powstrzymać to i podobne zjawiska (bo już jest za późno) tylko jak z nich się wyrwać - za późno już rozglądać się gdzie jest studnia, już do niej wpadliśmy, trzeba się zastanowić jak teraz się z niej wydostać?

Źródła

Oryginalny artykuł ze szwajcarskiej, niemieckojęzycznej gazety Das Magazin: https://www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/.

Jego angielskie tłumaczenie: https://motherboard.vice.com/en_us/article/mg9vvn/how-our-likes-helped-trump-win.

Jego polskie tłumaczenie: https://futrzak.wordpress.com/2016/12/20/w-jaki-sposob-trump-wygral-wybory/.

Wywiad z Michałem Kosińskim w Polityce (szczególnie polecam): http://www.polityka.pl/tygodnikpolityka/spoleczenstwo/1690344,1,jak-politycy-wykorzystuja-algorytmy-by-zdobyc-nasze-glosy.read.

Sort:  

To jest naprawdę bardzo interesujące. Dzięki za włożoną pracę.

Zgadzam się.

Dziwne jest, że od lat się interesuję technologią, internetem ale i tak co jakiś czas dowiaduję się czegoś co wprawia mnie w poważne zdumienie. :-).

Calling @originalworks :)
img credz: pixabay.com
Nice, you got a 5.7% @minnowbooster upgoat, thanks to @alcik
Want a boost? Minnowbooster's got your back!

The @OriginalWorks bot has determined this post by @alcik to be original material and upvoted it!

ezgif.com-resize.gif

To call @OriginalWorks, simply reply to any post with @originalworks or !originalworks in your message!

To enter this post into the daily RESTEEM contest, upvote this comment! The user with the most upvotes on their @OriginalWorks comment will win!

For more information, Click Here!
Special thanks to @reggaemuffin for being a supporter! Vote him as a witness to help make Steemit a better place!

Congratulations! This post has been upvoted from the communal account, @minnowsupport, by alcik from the Minnow Support Project. It's a witness project run by aggroed, ausbitbank, teamsteem, theprophet0, someguy123, neoxian, followbtcnews/crimsonclad, and netuoso. The goal is to help Steemit grow by supporting Minnows and creating a social network. Please find us in the Peace, Abundance, and Liberty Network (PALnet) Discord Channel. It's a completely public and open space to all members of the Steemit community who voluntarily choose to be there.

This post received a 4.15% upvote from @randowhale thanks to @alcik! To learn more, check out @randowhale 101 - Everything You Need to Know!

Congratulations @alcik! You have completed some achievement on Steemit and have been rewarded with new badge(s) :

Award for the number of upvotes

Click on any badge to view your own Board of Honor on SteemitBoard.
For more information about SteemitBoard, click here

If you no longer want to receive notifications, reply to this comment with the word STOP

By upvoting this notification, you can help all Steemit users. Learn how here!

Coin Marketplace

STEEM 0.19
TRX 0.16
JST 0.033
BTC 64105.03
ETH 2757.74
USDT 1.00
SBD 2.66