Firmy wiedzą o nas więcej niż nasi bliscy - dlaczego i czy jest czego się bać?
Żyjemy w dobie post-prywatności. Defetyści biją na alarm przekonani, że najczarniejsze fantazje George'a Orwella stają się rzeczywistością.
W świetnej powieści Autostopem przez Galaktykę, Ziemia i jej mieszkańcy byli obiektem eksperymentu przeprowadzanego przez panwymiarowe istoty, które dla niepoznaki upodobniły się do myszy. I choć to fikcja, to w świecie, w którym rządzi Big Data, możemy poczuć się jak obiekty eksperymentu wystawione na obserwacje przez odpowiednik wspomnianych istot. W naszym świecie są nim firmy, a raczej korporacje, które postawiły sobie nadrzędny cel - okiełznać potencjał Big Data, którego źródłem jesteśmy w dużej mierze my sami.
Big Data, to coś więcej niż cyfryzacja codziennego życia
Przypomnijmy sobie czym jest Big Data. To określenie na ogromne zbiory danych, zbieranych przez urządzenia elektroniczne, a których źródłem są sygnały płynące z naszego świata. Tymi sygnałami mogą być informacje o funkcjonowaniu urządzeń elektronicznych, wyniki różnorodnych pomiarów, a także wszelkie ślady, które po sobie pozostawia człowiek w elektronicznym świecie.
Kiedyś analiza Big Data ograniczała się jedynie do wyciągania podstawowych wniosków ze zgromadzonych informacji, czyli odcyfrowania tego co oczywiste i można wprost odczytać z takich danych. Powstawaniu takiego świata towarzyszyło (i nadal towarzyszy) zjawisko tak zwanej cyfryzacji. Naukowcy przestali zapisywać dane w kajetach, przesiedli się na komputerowe tabele, urzędy (opornie), ale coraz częściej komunikują się z nami drogą elektroniczną, firmy prowadzą elektroniczną księgowość, a uczniowie coraz rzadziej korzystają z papierowych zeszytów.
Cyfryzacja jest jednak niczym pierwsze wtajemniczenie. Big Data to kolejne etapy, które są pochodną praktycznie nieograniczonej generacji danych cyfrowych, często w sposób, którego sami nie jesteśmy (bądź nie chcemy) kontrolować.
Dla przykładu. Według analiz DOMO tylko w ciągu minuty użytkownicy samego Facebooka tworzą 2 460 000 nowych treści, w serwisie YouTube w tym samym czasie publikuje się 400 godzin materiałów wideo, a na Dropboxie ląduje ponad 833 tys. nowych plików. Poza oczywistymi śladami w sieci, takimi jak np. posty w mediach społecznościowych, pozostawiamy po sobie mniej oczywiste tropy i jest ich więcej niż mogłoby się wydawać. Każda odwiedzona strona internetowa i czas spędzony na jej przeglądaniu, frazy wpisane w wyszukiwarkę, przeglądane produkty i sfinalizowane zakupy, glokalizacja - nasza codzienna aktywność w Internecie nie przepada w próżni.
Big Data to podróż w nieznane
Pokłady Big Data są dziś tak duże, że nie wystarczy zwykłe „przekartkowanie”. Tak zwana papierkowa robota odeszła w przeszłość.
Analizowanie Big Data wymaga nie tylko zatrudnienia wyspecjalizowanych w tym firm (lub stworzenia odpowiednich oddziałów w ramach korporacji), one same muszą znać się nie tylko na analizie danych i wyciąganiu wniosków, ale nadto na stawianiu czoła nieznanemu. Są to specjaliści, znani jako data scientists i dostawcy platform DMP (data management platform), służących do zaawansowanej analityki nieustrukturyzowanych cyfrowych informacji pochodzących z licznych źródeł.
Bo tak właśnie wygląda dziś świat Big Data. Zgromadzone w jego ramach informacje mogą układać się w niespodziewane wzory, prowadzić do zaskakujących konkluzji. Liczba danych w sieci rozrasta się w tempie 40% rocznie, a ogromna ich część generowana jest przez internautów. To grupa społeczna, która pozornie jest przewidywalna, a w praktyce jest wielką niewiadomą. I właśnie zamiana przynajmniej części tej niewiadomej w konkretne składniki jest celem analizy Big Data.
Dziś mimo szybkiego rozwoju technologii tego typu, obecnie wykorzystuje się jedynie 20 proc. całego wolumenu Big Data. Według ekspertów z IDC, do 2020 r. liczba ta wzrośnie do 30 proc. Potencjał ukryty w nieokiełznanych zbiorach danych rozpala wyobraźnię ekspertów, a liczy się je w Zettabajtach.
Informacja znaczy dziś więcej niż kiedykolwiek
O tym że informacja to pieniądz wiadomo od zawsze. Kto miał dobre kontakty, wiedział gdzie uderzyć z inwestycją by najlepiej na tym zarobić, zawsze lądował na czterech łapach. Czasem proces zdobywania informacji był postrzegany w pejoratywny sposób, gdyż miał on związek z niezbyt uczciwymi praktykami.
Dziś pojęcie informacja ma znacznie szerszy zakres znaczeniowy niż kilkadziesiąt lat temu. Podobnie jak znacznie więcej danych przepływa w wewnątrz i na zewnątrz firm. IDC prognozuje, że do końca 2018 roku przepływ danych zewnętrznych w przedsiębiorstwach wzrośnie aż pięciokrotnie, zaś liderzy cyfrowej transformacji zwiększą ilość danych wychodzących co najmniej 500-krotnie. Co zawierają te dane? Choć związane są one z funkcjonowaniem firm, to skoro firmy istnieją dzięki pracy lub obsłudze społeczeństwa, to spora część tych danych jest związana z nami samymi.
I choć tylko 20% danych jest obecnie skutecznie analizowane, to wystarczy to by potentaci Big Data dokonywali rzeczy, o których wcześniej nie śnili najwięksi wizjonerzy. Ogromne możliwości jakie daje Big Data to między innymi wgląd w prywatność zwykłych obywateli.
Kowalski prześwietlony na wylot i to codziennie od nowa
Dane zbierają wszyscy, począwszy od supermarketów, przez firmy ubezpieczeniowe, na dostawcach usług internetowych kończąc. Standardem są dane kontaktowe i demograficzne, takie jak wiek, stan cywilny lub płeć, jednak są one prawdziwie przydatne dopiero wówczas, gdy zestawi się je z potężnymi zasobami Big Data - danymi pochodzącymi z różnych źródeł.
Prawdą jest, że o rodzaju gromadzonych informacji decyduje profil firmy. Tak np. dostawcy Internetu (ISP) rejestrują wszystkie odwiedzane przez nas strony, nawet jeśli korzystamy z przeglądarki w trybie prywatności. Wyszukiwarki internetowe znają historię wyszukiwanych przez nas haseł. Gigant z Montain View, m.in. dzięki przeglądarce Chrome i Google Analytics Solutions, wie nie tylko na jakie strony wchodzimy, ale również ile spędzamy czasu na poszczególnych podstronach. Taką wiedzę posiadają również hurtownie danych, a pozyskują ją m.in. dzięki plikom cookies. Największa taka hurtownia w Europie należy do Cloud Technologies, polskiej spółki notowanej na NewConnect. - Obecnie przetwarzamy już ponad 3 mld anonimowych profili internautów. Dokładnie analizujemy ich aktywność, zainteresowania i preferencje. Analizujemy dane demograficzne, geolokalizacyjne i tysiące innych zmiennych. Wszystko to odbywa się przy pomocy sztucznej inteligencji i uczenia maszynowego - tłumaczy jej CEO, Piotr Prajsnar.
To wystarczy by stwierdzić, czym się interesujemy, czego szukamy w sieci, jakie są nasze ulubione marki, czy jesteśmy w związku i jaki jest stan naszej zamożności. Użytkownicy telefonów z systemem Android, posiadającym usługę Google Now, mogą być pewni, że kalifornijska firma wie gdzie mieszkają i chodzą do pracy i wcale się z tym nie kryje. By sprawdzić historię glokalizacji wystarczy wejść na Google.com/maps/timeline/. Facebook również ma swoje za uszami. Analizując aktywność użytkowników i treść wiadomości potrafi z niespotykaną precyzją przewidzieć rozstania osób będących ze sobą w związku. Banki z kolei w procesach scoringowych analizują m.in. historię płatności kartą i aktywność w mediach społecznościowych.
Paradoksem jest fakt, że w czasach gdy tak bardzo zabiegamy o prywatność, tak łatwo ją sprzedajemy, by tylko zapewnić sobie wygodę. Gdy o szczegóły dopytuje się drugi człowiek indagowany od razu zaczyna być ostrożny, ale gdy takimi samymi informacjami chcemy nakarmić system cyfrowy, kompletnie o tym zapomina. Takimi informacjami są dane o klientach i ich zachowaniach.
W Stanach Zjednoczonych, każdy znaczący sprzedawca detaliczny posiada departament analityki predyktywnej, starający się zrozumieć nie tylko nawyki zakupowe swoich klientów, lecz także ich osobiste przyzwyczajenia i upodobania. Target Corporation, jedna z najlepiej zarabiających amerykańskich sieci handlowych zbiera ogromne ilości danych o każdej osobie, która przekroczy próg należącego do niej sklepu. Jej klienci otrzymują unikalne numery identyfikacyjne, powiązane z ich kartami płatniczymi, adresami e-mail i danymi pozyskanymi z zewnętrznych źródeł, a wszystkie produkty przez nich kupowane są skrupulatnie rejestrowane i analizowane przez system.
Algorytm mądrzejszy od ojca - przewidział ciążę
Zawierzyliśmy tak bardzo życie cyfrowym technologiom, że coraz trudniej dostrzegać nam to co powinno być oczywiste. A algorytmy komputerowe nie musza odpoczywać. Co więcej są coraz bardziej inteligentne. By trafić z przekazem marketingowym do kobiet będących w 3 trymestrze ciąży, data mainerzy z Target Corporation przypisali każdemu klientowi punkty, mające określić prawdopodobieństwo ciąży na podstawie historii zakupów. Udało się im zidentyfikować 25 produktów kupowanych przez kobiety w stanie błogosławionym.
Dla przykładu: fikcyjna klientka Jenny Ward ma 23 lat, mieszka w Atlancie, a w marcu kupiła kokosowe masło do ciała, wystarczająco dużą torebkę, by nosić w niej pieluchy, suplementy z cynkiem i magnezem i jasnoniebieski pled. Istnieje 87 proc. prawdopodobieństwo, że jest w ciąży, a termin rozwiązania wyznaczono na sierpień. Dzięki danym połączonym z jej Guest ID, Target potrafi pobudzić jej nawyki. System wie, że jeśli dostanie wiadomość mailem, to prawdopodobnie skłoni ją to do dokonania zakupu online, ale jeśli w piątek dostanie kupon drogą pocztową, to wykorzysta go podczas weekendowych zakupów - tłumaczy działanie systemu Andrew Pole, Marketing BI manager w Target.
Wiedza zgromadzona przez system analityczny może stać się przyczyną zabawnych, ale nie dla każdego sytuacji. Okazało się tak „gdy poddenerwowany ojciec licealistki pojawił się w jednym ze sklepów z pretensjami, że reklamy przesyłane niepełnoletniej dziewczynie są niemoralne, bo zachęcają ją do zajścia w ciążę. Gdy jeden z managerów po jakimś czasie zadzwonił do niego, by wyjaśnić sprawę, zamiast oskarżeń usłyszał przeprosiny. Okazało się bowiem, że uczennica jednej z amerykańskich szkół jest brzemienna, a system do analityki danych wychwycił ten fakt szybciej, niż jej własny ojciec”.
A może Wielki Brat nie jest taki zły, jak go malują
Od digitalizacji społeczeństwa nie da się uciec. Nawet jeśli zechcemy od niej odpocząć, to nie bez znaczącej zmiany naszego trybu życia. Może okazać się, że dla wielu osób to znacznie wyższy koszt niż zaakceptowanie obecnego stanu rzeczy.
Zdaniem Macieja Klepackiego, eksperta ds. cyfryzacji, wraz z rozwojem technologii mobilnych i Internetu rzeczy, wdziera się ona do naszego życia drzwiami i oknami. - Sceptycy widzą w niej same niebezpieczeństwa, jednak to z powodu udogodnień coraz częściej rezygnujemy z prywatności. To, w jaki sposób nowe technologie rewolucjonizują i ułatwiają naszą codzienną egzystencję sprawia, że jesteśmy w stanie przymknąć oko na inwazyjne działanie serwisów internetowych czy aplikacji mobilnych - twierdzi Klepacki.
Działania Wielkiego brata nie musza zresztą zaraz wiązać się z bezpośrednim naruszeniem prywatności. W dużym stopniu naruszenia, które nas najbardziej uderzają, są wynikiem bezpośredniego eksponowania życia na publicznym forum. A Big Data w dużym stopniu operuje na anonimowych zestawach danych.
W przypadku reklamy, gromadzenie anonimowych informacji o internautach przekłada się na liczne korzyści. Dotychczasowy sposób dystrybucji takich treści dorowadził popularyzacji adblocków i kryzysu w branży wydawnicze. W Polsce, według raportu OnAudience.com, blokuje się najwięcej, bo aż 42 proc. odsłon reklam w Internecie. Jak podaje serwis eMarketer, w 2016 r. z powodu takiego oprogramowania, globalne straty wydawców sięgnęły nawet 27 mld dolarów. Zastąpienie nachalnych kreacji wyświetlanych na chybił trafił reklamą precyzyjnie dopasowaną do potrzeb i zainteresowań internautów, ma przyczynić się do naprawy sytuacji na rynku wydawniczym i poprawy jakości serfowania w sieci.
Źródło: Cloud Technologies, inf. własna
Komentarze
5im już coraz bardziej odbija, argumentacja na poziomie RIAA z wydumanymi stratami przez piracących muzykę i filmy, brak tylko porównań do kradzieży i gwałtów ... sic!!!
Niech sie trzesa Ci, ktorzy maja cos do ukrycia, kradna, zabiajaja, rozpowszechniaja pornografie, planuja zamachy i takie rzeczy. Jestem jak najbardziej za inwigilacja, zeby wykluczyc ze spoleczenstwa chwasty.