Diky konferenci Cloud Computing 2019 byl navázán kontakt s určitou skupinou lidí a výsledkem je publikace v prestižním informatickém časopise s IF=2.217. Účast na zmíněné konferenci byla realizována díky projektu TAČR GAMA, který byl získán a je administrován KTT JU.
Článek diskutuje tématiku "velkých dat" z pohledu jejich kvality a možnostech zpracování. Jinými slovy, jak a pomocí čeho rozpoznat v rozsáhlých datových množinách, zda tato data mají správné rozložení, splňují závislosti, popřípadě jaké algoritmy ,reprezentace, či jaké výpočetní frameworky lze použít a jaké ne.
Pro představu, co jsou to ta velká data: jedná se např. o data uživatelů sociální sítě (uložených v datacentrech Facebooku po celém světě), o velikosti jednotek PB, která nejsou zpracovatelná klasickým přístupy. Tzn. takováto data musí být uložena na stovkách datových úložišť, fyzicky oddělených a propojených napříč různými kontinety a zpracovávají je výkonné paralelní počítače.
Článek hodnotí data pohledem různých vědců (kognitivního vědce, elektrotechnika, dvou informatiků, softwarového analytika, a bioinformatika) a shrnuje aktuální trendy a problémy v daných směrech.
Odkaz na publikaci je zde
Ing. Jan Fesl, Ph.D.