Ministerstwo Edukacji i Nauki

16.09.2021
PL EN
10.06.2021 aktualizacja 10.06.2021

O Big Data – czym są duże zbiory danych i jak je wykorzystywać

Jesteśmy w takim momencie historii, w którym gromadzenie i przechowywanie danych wzrasta w tempie niewyobrażalnym w stosunku do wcześniejszych dziesięcioleci – wskazuje Dawn E. Holmes. W swej książce "Big data" tłumaczy, czym są duże zbiory danych i jak można je wykorzystywać.

Każdego dnia użytkownicy internetu generują ogrom danych. Ile? Jak czytamy w książce, to ok. 2,5 eksabajtów (EB) danych. Jeden EB to milion terabajtów (TB), czyli 1 i po nim 18 zer. Dla porównania: nośniki pamięci przenośnych – pisze Holmes – są teraz dostępne z pojemnością 1 TB, co jest wystarczające, aby przechowywać ok. 500 godzin filmów lub ponad 300 000 zdjęć. A milion takich nośników? I to tylko jednego dnia.
 
Tymi danymi są nie tylko zdjęcia, filmiki czy tweety, ale i m.in. elektroniczna dokumentacja medyczna, dane z satelitów wykorzystywane w czasie rzeczywistym do nawigowania (GPS) czy dane z teleskopów. To też wszystkie nasze kliknięcia w wyszukiwarce internetowej. 
 
Autorka w książce krok po kroku tłumaczy logikę działania algorytmów i mechanizmów wykorzystywanych do analizy tych dużych zbiorów danych, w których chodzi o to, by przekształcić ten ogrom danych w użyteczne informacje. Podaje tu proste przykłady z życia codziennego, takie jak wykrywanie oszustw związanych z kartami kredytowymi czy wychwytywanie wśród maili spamu.

Zapoznaje też czytelnika z fachowym słownictwem i narzędziami - pisząc m.in., czym się różnią dane ustrukturyzowane od nieustrukturyzowanych albo o czym mówi Prawo Moore’a. Przy omawianiu kompresji danych Holmes tłumaczy mechanizm pozwalający zmniejszyć objętość plików przy zachowaniu ich pierwotnej jakości, a przy wspomnieniu narzędzia PageRank tłumaczy zasady porządkowania wyskakujących witryn po wpisaniu hasła w wyszukiwarce. 

Kolejne rozdziały obejmują tematykę dużych zbiorów danych w medycynie i służbie zdrowia, a także relacji big data-biznes m.in. na przykładzie Amazona czy Netflixa.  

W książce mowa również o bezpieczeństwie danych, konieczności ich szyfrowania i ich kradzieży na przykładzie historii Snowdena i WikiLeaks. Całość kończy się rozważaniami, jak duże zbiory danych zmieniają społeczeństwo i jak może wyglądać przyszłość z inteligentnymi domami czy miastami. 

„Big data” to kolejny tytuł z serii „Krótkie wprowadzenie” autorstwa ekspertów skupionych wokół Uniwersytetu Oksfordzkiego, wydanej przez Wydawnictwo Uniwersytetu Łódzkiego. Taka też jest ta książka – krótka, bo ma zaledwie 152 strony i faktycznie stanowi wprowadzenie do tematu pod kątem technicznym. 

To propozycja dla tych, którzy chcieliby poznać podstawy mechanizmów działania baz danych i algorytmów, choć wiedza tu przedstawiona to zaledwie wierzchołek góry lodowej. Ale taki też jest cel całej serii – wprowadzić w temat, by mieć o nim chociaż podstawowe pojęcie albo zachęcić do zgłębienia wiedzy. 

Agnieszka Kliks-Pudlik

Zapisz się na newsletter
Copyright © Fundacja PAP 2021