Szklana kula

Home / Uncategorized / Szklana kula

Szklana kula

Dzisiaj o przewidywaniu przyszłości i Big Data. Ludzie od zawsze chcieli wiedzieć, co przyniesie im jutro. Prognozy takie po latach bardzo często wywołują złośliwy uśmiech. Tak jak ta  z II połowy XIX wieku głosząca, iż obecne tempo rozwoju transportu konnego w Paryżu spowoduje, że na początku wieku XX łajno końskie zalegające na ulicach sięgać będzie pierwszego piętra (historia niestety zapomniała nazwiska tego proroka). Dzisiaj, dzięki masowym zbiorom danych, prognozowanie na podstawie informacji historycznych może być dużo bardziej precyzyjne. Oczywiście rację miał David Hume pisząc, że z tego, iż słońce wschodzi codziennie rano nie wynika, że będzie się tak działo zawsze. Rewolucję technologiczne przewidzieć jest trudno (taką jak wynalezienie samochodu). Jednak bardzo wiele istotnych zjawisk można przewidywać z dość precyzyjnie i z korzyścią dla wszystkich. Co więcej koszty takich analiz nie są wysokie, bo dotyczące jedynie przetwarza i analiz już istniejących danych. Przykłady?
  • W 2005 roku Guido Cervone w oparciu o analizy masowych zbiorów danych (data mining) z obserwacji satelitarnych opracował algorytm prognozujący podmorskie trzęsienia ziemi. Opiera się on na wykrywaniu pojawiających się w określony przestrzennie i czasowo sposób anomalii takich wielkości jak temperatura wody, ciśnienie powietrza, czy ruchy wody.
  • Inne dane w podobny sposób przeanalizowali uczeni z Malaysia University of Science & Technology. U pacjentów z zawałem standardowo stosuje się monitorowanie EKG umożliwiające szybką interwencję w przypadku pogorszenia ich stanu. Do analiz powalających lekarzowi ocenić stan chorego wykorzystywane są dane z konkretnych punktów pomiaru. Pozostałe metry zapisu EKG są „pustym zapisem”. Badacze sprawdzili jednak, czy istnieją powtarzalne wzorce zapisu, które są skorelowane z wydarzeniami przyszłymi (np. śmiertelnością przy kolejnym zawale) i odkryli, że takie nieopisane wcześniej  prawidłowości występują.
  • I przykład skandynawski (Skandynawia jest niekwestionowanym liderem w tego typu analizach danych publicznych). Sheilagh Hodings, epidemiolog i psychiatra, przeprowadziła badania dotyczące związku pomiędzy stosowanymi w chorobach psychicznych terapiami, a późniejszymi przestępstwami popełnianymi przez chorych. Analizę przeprowadzono na połączonych rejestrach medycznych i rejestrów przestępstw dla osób urodzonych od lat 40tych do 60tych (wszyscy chorzy!). Badanie to pokazało jakie, jakie terapie nie powinny być, a jakie powinny być stosowane.
Ostatni przykład oczywiście prowadzi nas do pytania o zagrożenia wynikające ze stosowania tego typu metod. Nietrudno sobie wyobrazić sobie „Raport Mniejszości II”. Oczywiście zjawisko data mining ma też swoje plusy ujemne. Wszystkie firmy posiadające dane transakcyjne na nasz temat (banki, fimy telekomunikacyjne, ubezpieczeniowe, sklepy…) profilują klientów. Mogą przewidywać zachowania charakterystyczne dla pewnych typów klientów, a w konsekwencji dla pojedynczych osób. Jeżeli bank odmówił Wam kredytu, mimo odpowiednich dochodów przychodzących regularnie na konto, to przypuszczalnie wasz profil jest zbliżony do profilu osób często nie spłacających kredytów. Powiedzmy jednak szczerze – banki od zawsze oceniały ryzyko nie spłacenia kredytu. Dzisiaj mają tylko bardziej precyzyjne narzędzia. Tak samo od dawna jest z ubezpieczeniami komunikacyjnymi – nikt się nie burzy, że młodzi mężczyźni muszą płacić wyższe składki. Gorzej będzie, gdy firmy oferujące ubezpieczenia zdrowotne zaczną powszechnie stosować metody indywidualnego profilowania. Wtedy osoba, która nie ma pojęcia, że ma wyższe ryzyko zachorowania na konkretna chorobę w ciągu następnych 10 lat zapłaci dużo wyższą składkę. Powiedzmy szczerze – Główny Inspektor Ochrony Danych Osobowych nie dysponuje ani narzędziami, ani zasobami, aby takim praktykom skutecznie przeciwdziałać. Co więcej sam pomysł, aby ich zakazać nie tylko jest próbą zaczarowania deszczu, ale także zablokuje korzystanie z Big Data w celach społecznie pożytecznych. Można i trzeba natomiast zrobić dwie rzeczy. Po pierwsze umożliwić firmom dostęp do innych danych (nie będący wynikiem ich relacji z klientem) tylko na wyższym poziomie agregacji. Po drugie i ważniejsze, można zakazać oferowania produktów, które różnicują klientów pod względem określonych cech. Jednocześnie administracja mogłaby wykorzystywać te dane jedynie w celu „dyskryminacji pozytywnej” (korzystniejszych rozwiązań dla osób w gorszej sytuacji). Nie jest to pomysł teoretyczny. Już dzisiaj tak się dzieje w przypadku ubezpieczeń społecznych. O wysokość emerytury decyduje średnie dalsze trwanie życia w momencie przejścia na emeryturę. Wiadomo powszechnie, że kobiety żyją dłużej (w Polsce dla osób w wieku 65 lat różnica sięga lat 4). Jednak średnia brana pod uwagę do emerytury jest wyliczana dla obu płci łącznię. Problem polega jednak na tym, że instytucje publiczne w Polsce przeważnie nie mają zielonego pojęcia, że Big Data, które posiadają mogą służyć obywatelom. Z jednej strony udostępniając im informacje przydatne w podejmowaniu codziennych decyzji (np. o długości kolejki w urzędzie), przy czym bardzo przydają się kompetencje Data Storytelling, chociażby w taki sposób. Z drugiej natomiast, na ich podstawie można podejmować decyzje dotyczące polityk publicznych (o czym w następnych odcinkach). Jednak podejście administracji do predykcji w oparciu o dane dobrze chyba charakteryzuje szklana kula rozdawana jako gadżet przez CBA. Sprawę opisał szczegółowo Piotr Vagla, więc nie będę jej streszczał. Żeby jednak dopełnić groteski - informacja, której tam nie znajdziecie. Jeżeli efekt śledztwa Vagli jest prawdziwy i autorem projektu kuli jest jeden z liderów Pomarańczowej Alternatywy - Wojtek Sobolewski, to jednak Surrealizm Socjalistyczny jest wiecznie żywy.
Recent Posts

Leave a Comment

Contact Us

We're not around right now. But you can send us an email and we'll get back to you, asap.

Not readable? Change text. captcha txt

Start typing and press Enter to search