Kéž bych se už dřív naučil spravovat svá data, říká v rozhovoru Matyáš Hiřman

Matyáš Hiřman je data steward a zároveň vede komunitu data stewardů v České republice. Ta se postupně stává důležitým prvkem v projektu Národní repozitářové platformy a v projektu IPs EOSC-CZ. Jak sám říká, je součástí zajímavého hlasu komunity, která má nabízet služby péče o vědecká data. O tom, jak probíhala jeho účast v kurzu správy dat na Vídeňské univerzitě a proč je dnes téma správy a ukládání dat tak aktuální, jsem si s ním povídala v Ústřední knihovně University Karlovy (UK), kde působí.

7. 5. 2024 Vladimíra Coufalová

Bez popisku

Kdo je data steward a co od něj výzkumná komunita může očekávat?

Data steward je v České republice nová pracovní pozice, která by měla dlouhodobě pomoci výzkumníkům v oblasti práce s výzkumnými daty a dodržováním podmínek, které se dnes v moderní vědě vyžadují. Rolí data stewarda je mnoho, nicméně tou podstatnou je vytvářet komunikační mosty mezi infrastrukturami a pomoci bezproblémovému chodu v data managementu. Já osobně jsem se v roce 2022 přihlásil do kurzu na pozici „data steward“ ve Vídni. Jednalo se o první pilotní kurz pozice data stewarda vůbec. Smyslem kurzu bylo, mimo praktické části, společně vymyslet a ucelit role a povinnosti data stewardů, které vyplývají se zvyšujících se nároků na otevřenou vědu a správu výzkumných dat. Do té doby se povinnosti se správu výzkumných dat většinou na někoho „hodily,“ ale momentálně těch povinností rapidně přibývá. Pilotní kurz měl pomoci nastartovat aktivní podporu tam, kde je potřeba.

Kdo kurz pro data stewardy pořádal?

Bylo to na Uni Wien a kurz organizovala a založila Tereza Kalová, která koordinuje program správy dat na Vídeňské univerzitě. Cílem bylo šířit osvětu, že pozice data stewarda vůbec existuje a měla by vznikat napříč nejen Evropou, ale celým světem, aby vědci na správu dat nebyli sami.

Které konkrétní role má data steward?

Role se převážně odvíjí od toho, kde data steward působí. Na UK máme tři úrovně data stewarda. V první úrovni řeší data steward obecné záležitosti datové politiky pro univerzitu, vzdělávání a zároveň koordinuje data stewardy z jednotlivých fakult, to je i moje pozice. V druhé úrovni jsou to již zmínění data stewardi, kteří nastavují standardy na jednotlivých fakultách. Třetí úroveň jsou data stewardi, kteří jsou součástí výzkumného týmu. Obecně by měl data steward pomáhat při dodržování postupů správy výzkumných dat.

Pamatuješ, jak jsi k otázce správy výzkumných dat dostal poprvé?

Studoval jsem na Přírodovědecké fakultě UK, kde nyní dodělávám doktorát a přirozeně jsem se musel starat o svoje výzkumná data, což ne vždy fungovalo tak, jak bych si asi momentálně představoval. Následně jsem nastoupil do Ústřední knihovny UK na pozici metodik výzkumných dat v přírodních vědách. Když jsem hledal, kde se v oblasti správy dat vzdělat, narazili jsme s kolegy na kurz ve Vídni a přihlásil jsem se na něj. Postupně se ukázalo, že data steward je pozice, která se ve vědecké komunitě začíná pravidelně objevovat a dává smysl. Byla to zpočátku víc náhoda, ale téma si mě postupně získalo.

Odkud se rekrutují data stewardi?

To je i pro nás komplikovaná otázka. Problém je v tom, že pozice je nová, vzdělávání pro ni ještě není obvyklé, a tak se ideální kandidáti zatím hledají složitě. Možnosti vzdělání v tomto oboru se rozvíjí pomalu. Obecně vzato může data steward být každý, kdo je zapálený do správy dat, nebo například někdo, kdo si ve své „laborce“ sám tvoří programy, které mu správu dat usnadňují. Potřebujeme lidi, kteří umí anglicky, nebojí se komunikovat, protože jejich velkou rolí je také vzdělávání ostatních. Lidi, kteří jsou nadšení pro techničtější obory a mají ideálně „background“ v oboru, ve kterém se budou pohybovat. Počítáme, že spíš nabereme lidi, které si postupně vychováme a vzděláme.

Inspiruješ se někde v zahraničí?

Česká republika do problematiky otevřené vědy a správy dat s ní spjaté skočila tak trochu „po hlavě“, bez dlouhodobější přípravy a vzdělávání lidí. Vracíme se na univerzitu ve Vídni, ale inspirujeme se i univerzitami například v Utrechtu a Heidelbergu. Třeba právě ve Vídni již mají pět fakultních data stewardů a svého koordinátora. To je příklad, který se nám líbí a rádi bychom ho měli i v našem prostředí. Také jsme součástí 4EU+ (European University Alliance), což je asociace sedmi univerzit v Evropě, kde si vzájemně předáváme zkušenosti.

Existuje speciální komunita data stewardů v Evropě?

Zatím jen na úrovni států, univerzit a knihoven. Komunita data stewardů napříč Evropou neexistuje, ale pořád máme kontakty s lidmi z vídeňského kurzu. Mít organizovanou komunitu by nicméně bylo určitě zajímavé.

Nedávno jsi se úzce začlenil do projektu Národní repozitářové platformy (NRP), jakou v něm máš roli?

Projekt je rozdělený do několika klíčových aktivit a Univerzita Karlova si vzala na starost klíčovou aktivitu sedm, zaměřenou na vzdělávání a lidské zdroje. V rámci této aktivity vznikly i pozice data stewardů, kde mám svou roli. Konkrétně na pozici data steward science, takže bych se měl starat o témata spojená s přírodními vědami. Jsou tam i pozice data stewardů pro humanitní a sociální vědy a další.

Jak je tahle pozice koncipovaná v projektu NRP?

Koncipujeme ji jako „train the trainer“ a primárně budeme reagovat na výsledky z jednotlivých klíčových aktivit projektu NRP. Například se vytvoří software na tvorbu data management plánů a naším úkolem bude vzdělat lidi, kteří tento software budou používat, což jsou konkrétně třeba právě další data stewardi. Budeme nabízet konzultace pro celé instituce. Důležitým prvkem bude již zmiňovaná česká komunita data stewardů, skrze kterou budeme jednotlivé části NRP testovat a reflektovat zpětnou vazbu.

Vnímáš iniciativu EOSC jako žádanou potřebu vědecké komunity, nebo víc tlak „shora“?

Původní myšlenka byla vytvořit prostředí, kde se podpoří komunity oborů a lidí, kteří produkují a spravují data, aby mezi sebou mohli svobodně a efektivně komunikovat podmínky správy dat. Bohužel EOSC občas působí, že se vyrobí produkt, který se lidem nutí. Osobně centralizaci nemám rád a větší smysl mi dává podpora komunit a oborů, na kterou se i v rámci české iniciativy EOSC moc těším.

Jak se Ti tvoje práce data stewarda prolíná do doktorského studia?

Zpětně si sypu popel na hlavu a říkám si, kéž bych se už dřív naučil spravovat svá data a dělat si v nich pořádek. Opakovaně v přírodních oborech narážíme na téma elektronických laboratorních deníků, kde se dají efektivně a jednoduše sdílet data a informace. To by pro naše data bylo nesmírně důležité. Zpětně mě mrzí, že jsem to neznal a nenaučil jsem se různé možnosti efektivní správy dat. Aktivní využití mé práce v rámci mého výzkumu asi příliš významné není, protože už jsem (snad) v posledním ročníku doktorského studia. Vědci často vnímají např. data management plány jako byrokratickou zátěž, což je pochopitelné. Já si naopak ale myslím, že to v širším pohledu dává smysl. Je důležité vědět, co se v projektu bude dít, naplánovat si kde a jaká budu mít data a podobně, což je něco na čem se nakonec shodneme i s těmi, kterým se to ze začátku nezdá.

Co bys poradil právě začínajícím doktorandům ohledně správy dat?

To by bylo na hodinovou přednášku. Důležité mi přijde hledat možnosti, třeba softwarové, jak si snadno a kvalitně ulehčit práci. Nebát se přijímat nové věci. Stačí předem zapřemýšlet nad správou dat, jak data pojmenovávám, kam je ukládám a například, že je dobré mít plán. Poslední věc je nebát se jít proti proudu. Doktorandi by se neměli bát přijímat změny, nebo je přímo navrhovat svým nadřízeným. Často to jsou právě oni, kdo vědeckou komunitu posouvají dále.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.