Wyścig o fotel prezydencki w Stanach Zjednoczonych to bardzo istotne wydarzenie dla światowej geopolityki. Sztaby wyborcze dwóch rywalizujących kandydatów starają się na różne sposoby dotrzeć do obywateli aby przekonać ich do swojego kandydata. W tym celu wykorzystuje się coraz to nowocześniejsze metody, łącznie z zaawansowaną analityką danych i określaniem preferencji wyborczych na podstawie śladów cyfrowych. Czy można jednak stwierdzić, że takie technologie już teraz są niezbędnym elementem kampanii i dają kandydatowi znaczną przewagę nad przeciwnikiem?
Za kulisami kampanii wyborczych
Zarządzanie współczesną kampanią wyborczą, kierując się informacjami z ankiet, sondaży i badań opinii staje się podejściem zupełnie przestarzałym i nieefektywnym. Składa się na to kilka czynników – takie podejście do tworzenia zbiorów danych jest czaso- i pracochłonne, a szybkość gromadzenia materiałów odgrywa coraz istotniejszą rolę w procesie tworzenia kampanii. Proces ten wymaga zastosowania bardziej zaawansowanych technologii. Jeszcze do niedawna wiązało się to z wysokimi kosztami, z których dużą część stanowiło magazynowanie i zarządzanie zgromadzonymi w bazie rekordami. Nie stanowi to jednak już tak dużej przeszkody, obecnie najbardziej problematyczne są braki kadrowe w postaci wysokiej klasy ekspertów Big Data (termin oznacza duże, zmienne zbiory danych). Budowa modeli predykcyjnych na podstawie zebranych materiałów wymaga zatrudnienia ludzi, którzy posiadają szeroki zakres wiedzy z różnych obszarów, między innymi analityki i modelowania danych oraz tworzenia algorytmów, pozwalających na generalizowanie na podstawie zaimportowanych informacji uczących. Tacy pracownicy są niezbędni w sztabach również ze względu na to, że partie stawiają na budowę własnych struktur bazodanowych. Jest to dla każdego podmiotu politycznego nieocenione źródło wiedzy o elektoracie. Analityka daje możliwość zbudowania modelu przewidującego zachowania wyborców oraz monitoringu zmian preferencji, co z kolei znacznie rozszerza pole do przygotowania skutecznej strategii i korekty prowadzonej działalności. Data Science (nauka o danych) pozwala też na ukierunkowanie kampanii na konkretne grupy docelowe oraz odniesienie wyników do ogółu. Ciężko odnaleźć jednak konkretne metody, ponieważ przedsięwzięcia technologiczne stosowane w kampaniach oraz zakres zbieranych danych są chronione. Z tego powodu temat ten nie jest podnoszony również w debacie publicznej, a wszelkie pytania właściwie od razu ucinane. Skutkiem tego jest powstawanie wielu spekulacji i obaw o prywatność wyborców.
Skąd pochodzą dane?
W roku 2012 sztab wyborczy Baracka Obamy zgromadził 1,5 mld dolarów na działania kampanijne. Do przygotowania programu zatrudniono około tysiąca pracowników oraz korzystano z usług ponad 2 milionów ochotników. Część źródeł podaje też liczbę analiz – wykonano ich ponad 100, a w trakcie przeprowadzono około 66 tysięcy symulacji. Symulacje opracowywane były na bieżąco, na podstawie wydarzeń w trakcie zmagań o fotel prezydencki; eksperci dążyli do tego by znać jak najwięcej informacji o otoczeniu kampanijnym i wykorzystywać je w symulacji oraz ewentualnych zmianach w prowadzonej aktywności. Źródeł tych informacji jest wiele, sprawdzano różnorakie kanały i dokonano ujednolicenia oraz wysokopoziomowej agregacji w celu tworzenia obrazu ogółu. Same dane to głównie informacje na temat preferencji wyborczych i raporty finansowe. Za pośrednictwem social media na bieżąco kontrolowano przebieg rekrutacji ochotników. Przekaz telewizyjny również podlegał kontroli i analizie w celu pozyskiwania najbardziej odpowiedniego czasu antenowego. Największe znaczenie miały jednak dane z mediów społecznościowych i Internetu. Na Facebook’u i innych portalach proces przetwarzania rozpoczynał się w momencie uzyskania dostępu do profilu wyborcy. Zbiory kont w portalach składały się na listy kontaktów. Równolegle kupowano i obrabiano dane demograficzne od firm, które przetwarzają takie szczegóły jak historia zakupów, skłonność do hazardu, zainteresowanie programami szybkiego wzbogacania się, problemy finansowe czy obecność na portalach randkowych. Dzięki plikom cookies sprawdzano jakie strony są najczęściej przeglądane i poddawano podziale typ tych stron. Możliwe stało się dostosowanie kwestii programowych do poglądów elektoratu i tak po pobycie na stronie o charakterze ekonomicznym i przejściu na stronę kandydata, pojawiały się wiadomości o planowanych programach finansowych. W trakcie wyborów w 2016 roku, kiedy rywalizowali Hillary Clinton i Donald Trump, wykorzystanie technologii stało się jeszcze bardziej zaawansowane. Firma Cambridge Analytica, która pracowała dla przyszłego prezydenta Stanów Zjednoczonych, zebrała ponad pięć tysięcy informacji na temat każdego wyborcy. Cały proces został rozpoczęty Facebookową ankietą. Była ona sformułowana w ten sposób, że na jej podstawie możliwe było stworzenie modelu opisującego osobowość obywateli. Cambridge Analytica za pomocą algorytmów uczenia maszynowego (ang. Machine learning) opracowała mechanizmy, dostosowujące reklamy do poglądów politycznych wyborców. Implementacja rozwiązań Big Data pozwalała rozpoznać jaka tematyka zostanie pozytywnie odebrana a obszar do testowania był bardzo szeroki, bowiem bazowano na dużym wolumenie danych. Taki zbiór próbowano zintegrować i zwizualizować tak aby otrzymać przydatne trendy, na podstawie których można podjąć wnioskowanie. Następnie wszystkie udostępniane treści można w odpowiedni sposób bardzo szczegółowo spersonalizować – zmianom podlegały nagłówki, podpisy pod konkretnymi obrazami czy nawet kolory na stronach.
Obama, Trump, Biden – prezydenci dzięki technologiom?
Chociaż Cambidge Analytica i sztab Donalda Trumpa działali w sposób innowacyjny, nie byli pierwszymi. Raczej rozszerzyli i pogłębili stosowany już schemat. Jak wcześniej wspomniano, z takiej metodyki prowadzenia działań kampanijnych korzystano już w 2012 roku, gdzie sztab Baracka Obamy dokonywał analiz kilkudziesięciu tysięcy możliwych scenariuszy mając na celu przewidywanie nie tylko zachowań wyborców, lecz co ważniejsze móc wywierać na nie wpływ oraz je zmieniać. Badacze pracowali każdej nocy aby na czas dostarczyć jak najbardziej dopracowane raporty. Wyniki prac przekazywane do politycznych doradców przyszłego prezydenta zostały przekładane na przekazy medialne. Świetnie zagospodarowanym polem był przede wszystkim internet i zarządzanie ruchami wyborców, przekierowując ich na wybrane strony na Facebook’u czy kanały na YouTube. Krokiem naprzód było założenie dedykowanej strony, która skupiała głównie młodych sympatyków Obamy i jednocześnie pełniła funkcję bazy wolontariuszy. Według niektórych ekspertów Big Data uzyskana przez ludzi Baracka Obamy była około dziesięciokrotnie większa niż ta, zebrana przez jego konkurenta – Mitta Romneya. Jednak wybory w roku 2016 wcale nie potwierdzają, że kandydaci, którzy mają przewagę technologiczną są zdecydowanymi faworytami. Wyścig Prezydencki 2016 określano mianem „klęski” analityki danych. Czołowym argumentem w tej kwestii miało być uczynienie przez Hillary Clinton domeny Data Science strategicznym elementem swojej kampanii wyborczej a sztab kandydatki demokratów miał skupiać się zdecydowanie bardziej na wykorzystaniu technologii niż ludzie Donalda Trumpa. Widać więc wyraźnie, że samo pozyskiwanie i zbieranie danych nie jest wystarczające do zdobycia konkurencyjnej przewagi. Magazynowanie danych, nawet przy ich dużym wolumenie nie daje gwarancji sukcesu ani zwycięstwa. Najbardziej istotnym elementem jest odpowiednia agregacja i obróbka w taki sposób, aby odczytać z nich odpowiednie tendencje, znaleźć korelacje pomiędzy wartościami oraz odpowiednio wykorzystać zasoby – wówczas można mówić o właściwie rozumianej analityce i inżynierii danych. W powyższym przypadku sztab polityczny republikanów prawdopodobnie efektywniej wykorzystał narzędzia Big Data co sprawiło, że 45. Prezydentem Stanów Zjednoczonych został ich kandydat. Ostatnie wybory jednak pokazały, że wykorzystane wcześniej metody cały czas są rozwijane i wykorzystywane i chociaż ostatnie wybory były przeprowadzane w szczególnych okolicznościach tym razem zwyciężył demokrata Joe Biden. Wszystko wskazuje jednak na to, że metody korzystania z rozwiązań bazodanowych i uczenia maszynowego będą w dalszym ciągu rozwijane, a kandydaci coraz chętniej będą po nie sięgać.