Jak se buduje prostředí pro sdílení a dlouhodobé uchování výzkumných dat?

Rozhovor s Danielem Mikšíkem o tom, jakou úlohu sehrává Národní datová infrastruktura, jaký význam mají metodici a správci repozitářů a jaké benefity může přinést nové hodnocení datových sad jako samostatného výsledku výzkumu.

13. 2. 2026 Lucie Skřičková

Bez popisku

Profesní dráha Daniela Mikšíka není na první pohled typicky přímočará. Vystudoval anglistiku a bohemistiku, dlouhodobě se však pohybuje na pomezí technologií, výzkumu a podpůrných služeb pro vědu. Právě tato kombinace humanitního vzdělání a technologické IT praxe mu umožňuje nahlížet na výzkumná data především jako na nástroj, který má sloužit lidem.

Vaše profesní dráha je poměrně neobvyklá – od anglistiky a bohemistiky až k vedení IT centra. Jak Vás humanitní vzdělání ovlivňuje v tom, jak dnes přemýšlíte o technologiích ve vědě a výzkumu?

To je těžká otázka, protože vypreparovat z dosavadní životní zkušenosti specificky humanitní vzdělání a jeho vliv dost dobře neumím. Sleduji ale práci kolegů z mé mateřské Filozofické fakulty MU na webu Digital Humanities a tam mě nedávno zaujal článek o konceptu výzkumných dat – vykládat a zpřesňovat základní pojmy používané k popisu spojité skutečnosti, je za mě trvale důležitý příspěvek humanitních věd, pokud to dělají dobře. Klíčové sdělení textu a odkazované literatury pro mě bylo ještě o něco bazálnější. Ústřední role ve vědeckém provozu (stále ještě) náleží konkrétním lidem, kteří mají hluboké znalosti a netriviální dovednosti, z nichž pramení jejich schopnost rozhodnout se, jaké údaje potřebují shromáždit a jak je musí zpracovat, aby je pak mohli věrohodně a smysluplně interpretovat. Tito jednotliví, koneční, omylní, poctiví a vášniví lidé budují z „hromad dat“ poznání, a tyto lidi mají námi vyvíjené služby a nástroje v jejich práci podpořit.


V souvislosti s technologiemi často zaznívá, že by měly především sloužit lidem. Jak se tento princip podle Vás promítá do správy výzkumných dat a národní infrastruktury a kde v tom vidíte konkrétní přínos pro samotné vědce a vědkyně?

Když slyším, že technologie mají „především sloužit lidem“, zpozorním. Tahle formulace se totiž často používá tam, kde ve skutečnosti slouží hlavně velmi specifickým skupinám lidí. Proto bych „konkrétní přínos“ raději zjišťoval zpětně, zdola, z reálného používání. Mohu ale popsat, co už dnes při budování Národní datové infrastruktury děláme proto, aby ji vědci při každodenní práci skutečně mohli používat jako něco, co jim pomáhá a slouží– a ne naopak. Stavíme na technologiích, které jsou v oblasti ukládání a zpřístupňování výzkumných dat osvědčené a kvalitní (Invenio, DSpace, Data Stewardship Wizard aj.), a propojujeme je s existujícími infrastrukturními službami, zejména úložišti a výpočetním prostředím e-INFRA CZ. Nasazení zajišťují zkušení vývojáři, komunikaci s vědeckou komunitou metodici a na uživatelské zkušenosti systematicky pracuje specializovaný UX tým. Průběžně sbíráme zpětnou vazbu a zapracováváme ji do dalšího vývoje.

Před závorku je vytčen obecný princip navrhování a realizace IT služeb: identifikovali jsme potřebu kvalitní správy výzkumných dat a známé postupy, jak ji naplnit – repozitáře, principy FAIR, podporu strojového zpracování dat a metadat. Na jejich základě dnes vytváříme a zpřístupňujeme konkrétní nástroje: národní repozitářovou platformu, přenos dat z přístrojů, napojení na výpočetní prostředí a další služby.

Pak se ve „skutečnosti nejskutečnější“ obecný nástroj potká s konkrétní potřebou konkrétního vědce nebo týmu v jejich reálném kontextu, a my v komunikaci s nimi zjišťujeme, co funguje, co chybí a kde je potřeba nástroje dál rozvíjet, aby dávaly smysl v praxi. A tato zjištění pak zakomponujeme do dalšího vývoje.


„Když slyším, že technologie mají „především sloužit lidem“, zpozorním. Tahle formulace se totiž často používá tam, kde ve skutečnosti slouží hlavně velmi specifickým skupinám lidí.“

Zkušenost z praxe ukazuje, že data sama o sobě nestačí. Jak důležitá je podle vás role metodiků, správců repozitářů a lokální podpory na institucích pro to, aby s daty šlo reálně pracovat? 

V Pravidlech pro zakládání repozitářů v NRP je repozitář definován jako „technické, personální a procesní zajištění dlouhodobého úložiště pro ukládání a publikaci citovatelných digitálních objektů“. Jako většina definic je trochu šroubovaná, ale v první části dobře vystihuje, že repozitář není jen technologie. Teprve dlouhodobou a kvalifikovanou péčí o to, aby repozitář obsahoval relevantní a dobře popsaná data, která jsou transparentně přístupná a znovu využitelná, se z technického řešení stává funkční celek, který v konkrétní vědecké komunitě může po čase plnit roli důvěryhodného zdroje dat. Členové dané odborné komunity tvořící tým repozitáře (správci, datoví kurátoři, technická podpora) jsou nedílnou součástí tohoto celku.


Od letošního roku je možné vykazovat datové sady jako samostatný výsledek typu T. Co tento krok podle vás znamená pro postavení výzkumných dat ve vědě? 

To je, myslím, ještě obtížné hodnotit. Za sebe to vnímám především jako odraz již probíhající změny ve vědecké praxi – o data je vhodné pečovat, a proto úroveň této péče bude součástí hodnocení vědecko-výzkumných institucí.

Jak budou na druhé straně s vykázanými digitálními kolekcemi dat následně pracovat hodnotitelé, a tedy jak se datové sady a jejich parametry skutečně promítnou do hodnocení jednotlivých institucí, se teprve musí ustavit. A také na tom bude záviset, jaké signály tento proces zpětně vyšle do institucí a přes ně do české vědecké komunity, a jak se nakonec tyto signály projeví v rozhodování institucí i jednotlivých vědců, vědkyň a vědeckých týmů.


Může to podle vás změnit způsob, jak vědci o datech přemýšlejí už v průběhu výzkumu, a ne až ve chvíli, kdy se řeší závěrečné vykazování výsledků? 

Jak výzkumníci přistupují ke svým datům, je výsledkem mnoha faktorů. Vykazování digitálních kolekcí dat bude jedním z nich, ale osobně bych jeho roli nepřeceňoval. Podle mě mají mnohem větší význam zvyklosti a standardy v jednotlivých vědeckých komunitách, tedy jaká data má smysl ukládat a zpřístupňovat, jak je potřeba je popsat, a dále institucionální podpora v podobě strategie, interních předpisů a dostupnosti podpůrného personálu. A souvisí s tím také vzdělávání, tedy v jaké podobě se data management daří učinit součástí vysokoškolského studia nebo celoživotního studia. Všechny tyto oblasti se snaží systematicky podpořit a rozvíjet i národní implementace iniciativy EOSC.


Součástí infrastruktury je i Národní metadatový adresář (NMA). Proč je důležitý i pro vědce, kteří se o infrastrukturu běžně nezajímají?

Pokud se podaří naplnit ambici shromažďovat v NMA metadata o datových sadách afiliovaných k českým institucím téměř v reálném čase, vznikne služba s unikátním obsahem a dalšími důležitými vlastnostmi, například s veřejným API, které umožňuje shromážděná metadata s minimálními náklady vyčíst a následně zpracovat.

Díky jednotnému metadatovému standardu bude možné vyhledávat datové sady napříč tematickými repozitáři, identifikovat jejich překryvy a metadata dále propojovat. V první fázi bude tato služba relevantní zejména pro instituce (přehledy a analýzy). S přibývajícími repozitáři vybudovanými v prostředí Národní repozitářové platformy (NRP) se její přínos, předpokládám, stane zřejmějším i pro samotné výzkumnice a výzkumníky.


„Podle mě mají mnohem větší význam zvyklosti a standardy v jednotlivých vědeckých komunitách, tedy jaká data má smysl ukládat a zpřístupňovat, jak je potřeba je popsat, a dále institucionální podpora v podobě strategie, interních předpisů a dostupnosti podpůrného personálu.“

Bez popisku

Mgr. Daniel Mikšík


vystudoval anglistiku a český jazyk a literaturu na Filozofické fakultě Masarykovy univerzity. Od roku 2004 působil na této fakultě v Centru informačních technologií a podílel se mimo jiné na práci s paralelními jazykovými korpusy, na rozvoji elearningu a na vybudování technické a datové infrastruktury Digitalia MUNI ARTS; v letech 2010–2024 zastával roli vedoucího Centra informačních technologií FF MU. V současnosti působí jako IT architekt v rámci Ústavu výpočetní techniky MU, ve výzkumném centru CERIT-SC, které se zaměřuje na datově náročný výzkum a podporu vědeckých komunit. V projektu Národní repozitářové platformy (NRP) vede aktivitu zaměřenou na pilotní repozitáře (KA3), jejichž úkolem testovat a ověřovat budovaná řešení pro správu, sdílení a dlouhodobé uchovávání výzkumných dat v souladu s principy FAIR.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.