Dôležitá úloha dátovej analýzy

S dátovou analýzou sa v súčasnosti stretávame stále viac. Mnohí však nevedia, čo toto slovné spojenie v skutočnosti znamená a ako sa v biznise využíva. Čo si teda predstaviť pod pojmami dátová analytika či dátová analýza a kde nachádzajú uplatnenie?

Zjednodušene povedané analytika je odbor, ktorý sa zaoberá vypracovaním analýz. Takže v našom prípade – v rámci projektu Efektívne regióny sa dátová analýza zaoberá analýzami dát – údajov k zvoleným ukazovateľom, ktoré sa v projekte riešia. Dátová analýza je tak procesom vyhodnocovania dát (údajov,  informácií), na ktorý sa používajú rôzne logické metódy a úvahy.

Vynikajúcou súčasťou dátovej analýzy je možnosť analyzovať obrovské objemy štruktúrovaných aj neštruktúrovaných dát a pracovať s nimi v reálnom čase. Tento prístup je v projekte veľmi intenzívne využívaný, keďže viac-menej všetky údaje, s ktorými v projekte pracujeme sú nesúrodé bez jednotnej štruktúry, či kvality. Prostredníctvom správnej interpretácie a pochopenia nadobúdajú spracovávané dáta úplne inú výpovednú hodnotu.

Ako teda prebieha dátová analýza? Vzhľadom na to, že výsledkom dátovej analýzy je získať nejaký záver – zhodnotenie, je nevyhnutné si v prvom kroku cieľ analýzy jasne stanoviť a popritom si určiť čo sa bude merať a akým spôsobom (metodikou) budú základné údaje vyhodnotené.

Druhým krokom je samozrejme zber relevantných dát, keďže nie všetky dáta, ktoré máme k dispozícii, aj súvisia s našim problémom.

Pre ilustráciu rýchlosti pribúdania dát, môžeme citovať bývalého šéfa Googlu Erica Schmidta, ktorý ešte v roku 2010 povedal, že každé dva dni ľudstvo vyprodukuje toľko dát, ako vyprodukovalo od počiatku civilizácie po rok 2003. To číslo sa, samozrejme, stále zvyšuje a objem dát exponenciálne narastá.

Predstavte si teda aké obrovské je množstvo dát, ktoré nám síce na prvý pohľad nič nehovoria, avšak ak ich začneme analyzovať, vieme získať vysoko relevantné odpovede na položené otázky.


Dôležité je stanoviť si aj parametre dát.
Inými slovami ide o určenie typu dát, ktoré sú potrebné na vyriešenie problému. Stanoví sa, čo sa bude merať a zároveň ako sa bude merať. Táto fáza je častokrát kľúčová, pretože práve v tejto fáze zisťujeme, že potrebné dáta napríklad nemusíme mať k dispozícii alebo nie sú dostupné v potrebnej kvalite.

Ak také niečo nastane, je na rozhodnutí analytika, resp. projektového tímu, či sa aj napriek tomuto faktu rozhodne investovať čas a prostriedky do spracúvania takýchto dát, ktoré bude samozrejme mnohonásobne zložitejšie, alebo sa analytický proces vráti na začiatok a pokúsi sa uspokojivo predefinovať problém. Každopádne, zvolenie správnych dát a ich kvalita je kľúčovým vstupom k úspešnosti celého procesu analýzy.

Zberu dát následne prebieha prostredníctvom tzv. data miningu – doslova ťažby dát a data cleansingu – čistenia a úpravy dát do žiaducej podoby. Je nutné povedať, že príprava dát na samotnú analýzu je skutočne značne zdĺhavým procesom, no našťastie už v súčasnosti existuje množstvo nástrojov, ktoré v tomto dátovým analytikom významne pomáhajú.

Predposledným krokom je hlbšia analýza dát, čiže ich vyobrazenie v grafickej podobe, štatistické výpočty (korelácie, štandardné odchýlky,…), filtrovanie a iné operácie, ktoré sa vykonávajú pomocou ďalších nástrojov. Aj v tomto kroku sa však môže zistiť, že je potrebné “vyťažiť” ďalšie dáta.

Na záver prichádza na rad interpretácia výsledkov analýzy, čiže či výstupy zo spracovania vybraných dát zodpovedali otázky, ktoré boli položené? Aj v tomto kroku však treba myslieť na to, či sme do nej zahrnuli všetky potrebné dáta a či sme sa na vec pozreli z viacerých uhlov pohľadu.

Dátová analýza v projekte Efektívne regióny, ktorý je podporený z Európskeho sociálneho fondu prostredníctvom OP EVS, je nevyhnutným krokom k získaniu odpovede na základnú otázku, ktorú si v projekte kladieme – či VÚC využívajú financie efektívne vzhľadom na potreby obyvateľov Slovenska v oblasti dopravy, vzdelávania a životného prostredia.