Open Science je aktuálně ve fázi Fénixe, který prolétl výzkumnými institucemi

Vědecký výzkum v interdisciplinárním prostředí přináší řadu výzev, zejména pokud jde o dostupnost a správu dat. V rozhovoru s docentkou Hanou Tomáškovou, prorektorkou pro vědu, výzkum a transfer znalostí Univerzity Hradec Králové jsme se bavili o tom, jak dnes funguje otevřená věda v Česku, kde naráží na největší překážky a proč je někdy správa dat větší oříšek, než by se zdálo.

8. 7. 2025 Lucie Skřičková

Bez popisku

Váš výzkum propojuje systémovou analýzu, procesní modelování a aplikace v různých oblastech, od zdravotnictví po průmysl. Jaké výzvy přináší práce s daty v takto interdisciplinárním kontextu?

Největší výzvou je dostupnost a sdílení dat. Často buď neexistují, nebo nejsou veřejně přístupná. V takových případech pracuji s odhady a kladu důraz hlavně na samotný model, který má ukázat princip, ne konkrétní čísla. Tam, kde jsou data k dispozici, jsou zásadní pro validaci a porovnání různých modelových přístupů. Významnou roli hrají i vizualizace – zejména notace Business Process Modeling Notation (BPMN), která pomáhá komunikovat složitost systému srozumitelně napříč rolemi.


Jak se v tomto kontextu proměňuje vnímání otevřené vědy? A co to znamená pro samotné vědce?

Otevřená věda změnila způsob, jakým přistupujeme k datům – dnes máme mnohem lepší možnosti přístupu i sdílení, což je obrovský posun oproti době, kdy jsem začínala. Zároveň to ale klade vyšší nároky na správu dat a celkovou organizaci výzkumu. Sama jsem si uvědomila, jak důležitý je dobře promyšlený plán správy dat. Dřív jsem data brala jako „spotřební materiál“ a později litovala, že jsem si jejich správu nedomyslela. Repozitáře dnes velmi pomáhají i při zpětném dohledání vlastních dat ve standardizované podobě. Výzvou zůstává i sdílení, které není vždy možné, ale pokud je, jde o cenný nástroj pro ověřování a srovnání.


Při práci s procesními modely v nemocnicích i firmách sbíráte data přímo v terénu a následně je analyzujete. Jak si v takových případech poradíte s jejich omezenou dostupností nebo kvalitou?

Výhodou procesního modelování je, že může sloužit i jen pro ukázku fungování a postupů nyní a pro porovnání, jak by to mohlo vypadat, když... To mi umožňuje využít třeba jen veřejně dostupná či sdílená data z repozitářů, nebo jen popis fungování v rámci veřejné dokumentace a nemusím žádat o povolení a správu citlivých dat. Velice často se při procesní analýze zjistí, že pro určitou část systému data zatím neexistují. Pak se data expertně odhadnou, ale zůstávají konstantou, aby neovlivňovala efektivitu procesní změny.


„Výzvou zůstává i sdílení, které není vždy možné, ale pokud je, jde o cenný nástroj pro ověřování a srovnání.“

Ve své práci jste se zabývala modelováním dopadů Alzheimerovy choroby, které vyžaduje práci s citlivými daty. Jsou podle Vás v Česku vytvořeny podmínky pro jejich bezpečné ukládání a smysluplné využití ve výzkumu?

V tomto případě jsme naštěstí mohli vycházet z veřejně dostupných dat, konkrétně ze statistik Českého statistického úřadu a výkazů zdravotních pojišťoven. Tato data mají celorepublikovou platnost a pro modely systémové dynamiky byla ideální. Na druhou stranu, práce s opravdu citlivými pacientskými daty pro výzkumné účely byla, především v době mého doktorského studia, téměř nemožná. Neexistovaly jasné mechanismy, jak získat výjimku nebo povolení k využití těchto dat, ani infrastruktura, která by umožnila jejich bezpečné zpracování. Mnohé výzkumné záměry tak skončily ještě dříve, než začaly. Navíc by tehdy bylo potřeba investovat obrovské úsilí do samotného vyčištění a standardizace těchto dat, často větší, než si vyžadoval samotný výzkumný model.

Dnes je situace výrazně lepší. V některých oblastech, například při vývoji učících se algoritmů, už dochází k aktivnímu sdílení a anonymizaci dat, což otevírá nové možnosti. Pozoruji i změnu myšlení. Tam, kde dříve převládal individualismus a neochota ke sdílení, dnes roste důraz na hledání lepších řešení, například přesnější detekce nebo predikce, v mnoha případech právě díky otevřenému přístupu k datům.


Jak byste charakterizovala současný stav otevřené vědy na českých vysokých školách a výzkumných institucích? V čem podle Vás dochází k nejvýraznějšímu posunu a jaké oblasti stále zůstávají problematické?

Řekla bych, že za poslední rok je stav Open Science ve fázi Fénixe, který povstal z popela a se zářivým vzhledem prolétl výzkumnými institucemi. Všude nechal zaseté semínko dobré myšlenky, na kterém pracujeme, přijali jsme je za své a budujeme prostředí pro “okrasnou zahrádku s budoucím stromem Open Science". To jsem si trochu zabájila, ale opravdu vnímám výrazný pokrok v osvojení principů a ve snižování rezistence.

Co stále chybí? Uvedla bych nejistotu ve volbě vhodného repozitáře pro sdílení dat. Existuje řada doporučovaných, podporovaných, známých a používaných repozitářů. A právě tato rozmanitost může být problematická. Obávám se, že pokud by ze strany státu, ministerstev, Evropské unie či dalších nadřazených subjektů došlo k necitlivému výběru nebo regulaci, mohlo by to narušit důvěru a stabilitu celé komunity.


„Dnes je situace výrazně lepší. V některých oblastech, například při vývoji učících se algoritmů, už dochází k aktivnímu sdílení a anonymizaci dat, což otevírá nové možnosti.“

S jakými systémovými překážkami se podle Vás výzkumníci nejčastěji setkávají při snaze sdílet svá data?

Nedostatek času dnes trápí téměř každého a je pravda, že infrastruktura i systémová podpora by mohly být vždy lepší. Na druhou stranu také slýchám, že právě tyto důvody slouží spíše jako výmluva než jako skutečná překážka. Co se v praxi skutečně osvědčuje, je podpora ze strany kompetentního člověka, někoho, kdo je klidný, vytrvalý, má hluboké znalosti a dokáže výzkumníka provést celým procesem.

Velkou roli hraje důvěra. Pokud se podaří vytvořit funkční vztah mezi výzkumníky a oddělením pro otevřenou vědu, situace se výrazně zjednoduší. Na Univerzitě Hradec Králové se to například daří paní doktorce Lence Špičanové, která tuto důvěru buduje velmi úspěšně.


Které aspekty správy výzkumných dat považujete za nejvíce podceňované?

Děkuji za otázku. Správa výzkumných dat je komplexní proces a jednotlivé aspekty do sebe často zapadají tak těsně, že je těžké je od sebe oddělit. Z vlastní vědecké praxe považuji za nejvíce podceňovaný, a zároveň nejvíce odkládaný aspekt standardizaci a interoperabilitu dat. Plány správy dat, specifikace výzkumných dat, jejich organizace a ukládání – to už dnes vědci víceméně přijímají jako součást běžné výzkumné činnosti. Ale jakmile dojde na formální úpravu dat, jejich strukturování a sladění s obecně uznávanými standardy, tak to bývá vnímáno jako zbytečná práce navíc. Přitom jsou to právě tyto kroky, které rozhodují o tom, zda budou data opakovaně použitelná, srozumitelná i pro ostatní, a tedy i udržitelná.

Má-li jakýkoli systém fungovat, musíme do něj vkládat takové úsilí a data, která z něho potřebujeme čerpat. Jakékoli obcházení nebo polovičaté řešení podkopává celý rámec, na kterém má důvěryhodná věda stát.


„Velkou roli hraje důvěra. Pokud se podaří vytvořit funkční vztah mezi výzkumníky a oddělením pro otevřenou vědu, situace se výrazně zjednoduší.“

Jaká byla vaše osobní zkušenost s implementací FAIR principů a jaké výzvy vnímáte v českém prostředí při jejich zavádění?

Když jsem se poprvé setkala s FAIR principy, připadalo mi to jako skvělý nápad. Okamžitě jsem přemýšlela, jaká data bych mohla díky tomu získat a jak je využít pro modelování nebo analýzy. Jako uživatel systému jsem byla nadšená. O to tvrdší náraz přišel ve chvíli, kdy jsem se ocitla v roli poskytovatele dat. Teprve tehdy jsem pochopila komplexnost a nezbytnost některých nepopulárních kroků procesu.

Za výzvu jsem si definovala nastavení podmínek, pomocných kroků a podpory přesně definující proces tak, aby se nedal “vošvejkovat”. My Češi jsem mistři v hledání kliček, obcházení a zlehčování si práce. Proto je v rámci komplexního fungování potřeba precizně dodržovat principy a implementovat je v té nejčistší možné podobě.


Pokud byste měla doporučit jedno konkrétní opatření, kterým by výzkumná instituce mohla výrazně podpořit rozvoj otevřené vědy, co by to bylo?

To je velmi důležitá otázka. Moje odpověď možná nebude nijak převratná, ale myslím, že automatizace by v současnosti přinesla největší praktický dopad. Vím, jak rozmanitá a složitá jsou data, formáty a datové struktury, a to často už jen v rámci jednoho oboru, natož napříč obory. Ale právě v tom je síla automatizace. Dokáže výrazně zjednodušit rutinní a neoblíbené části procesů, které jsou zpočátku často vnímány jako zbytečné administrativní zatížení.

Každý krok, který usnadní vstup do systému, ať už jde o vyplnění metadat, výběr repozitáře nebo validaci dat, snižuje odpor vůči celému konceptu otevřené vědy. A jakmile se přestane “žehrat” na drobnosti, uvolní se prostor pro pozitivní přijetí celého systému.


„My Češi jsem mistři v hledání kliček, obcházení a zlehčování si práce. Proto je v rámci komplexního fungování potřeba precizně dodržovat principy a implementovat je v té nejčistší možné podobě.“

Doc. Ing. Hana Tomášková, Ph.D.


je prorektorkou Univerzity Hradec Králové pro vědu, výzkum a transfer znalostí a působí jako docentka na Fakultě informatiky a managementu, kde vyučuje Objektové modelování, operační výzkum, procesní modelování, systémové myšlení a další předměty. Vystudovala informatiku na UHK, kde rovněž získala doktorát v oboru informační a znalostní management a v roce 2014 se habilitovala prací zaměřenou na modelování a simulaci diskrétních systémů. Ve své vědecké činnosti se zaměřuje na systémovou analýzu, procesní modelování či dynamiku v oblasti energetiky a zdravotnictví. Je autorkou více než 90 odborných publikací a aktivně působí také v soukromém sektoru.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.