Open Science II (OS II)

Základní informace projektu

Název Operačního programu: Operační program Jan Amos Komenský
Název a číslo výzvy: Open Science II, 02_24_030
Název projektu: Open Science II
Registrační číslo projektu: CZ.02.01.01/00/24_030/0015041
Příjemce: Univerzita Karlova
Období realizace projektu: 1. 10. 2025 – 31. 12. 2028

Anotace projektu

Projekt Open Science II podporuje budování Národní datové infrastruktury (NDI) a implementaci iniciativy EOSC v ČR. Zaměřuje se na rozvoj a vznik oborových repozitářů, FAIRifikaci dat, interoperabilitu, vývoj nástrojů, vzdělávání a komunikaci. Do aktivit zapojuje i širší výzkumnou komunitu prostřednictvím otevřené soutěže - tzv. minizáměrů, čímž přispívá k systémové změně v nakládání s výzkumnými daty v souladu s principy FAIR.

Cíl projektu

Cílem projektu je zajištění jednotné a koordinované infrastruktury, která zároveň respektuje oborová specifika a umožní efektivní správu, sdílení a opětovné využití výzkumných dat. Ta bude fungovat v souladu s principy FAIR a v intencích implementace iniciativy EOSC v ČR, a to v následujících oblastech:

  1. Rozvoj, konsolidace a vytváření nových oborově-vědních a mezioborových repozitářů výzkumných dat, jejich napojení do NRP a integrace do NDI, včetně podpory a rozšiřování uživatelských komunit. Vytvořeno bude 16 nových oborově-vědních repozitářů a inovováno 6 oborově-vědních repozitářů.
  2. Zajištění bezpečného, standardizovaného a dlouhodobě udržitelného prostředí pro ukládání a sdílení dat, podpora interoperability, tvorba a standardizace metadatových modelů, standardizace a reorganizace dat, kontrola konzistence a datový cleaning. Zajištění FAIRifikace a oborové a mezioborové interoperability jsou komplementárním cílem vůči výše stanovenému dílčímu cíli 1.
  3. Vývoj a pilotní zprovoznění nástrojů a služeb důležitých pro zajištění a rozvoj služeb celku NDI, zejména specifické služby pro práci s citlivými daty, pro usnadnění přístupu a publikace dat, pro posílení kyberbezpečnosti a generování a správu důvěryhodné provenance. Budou vyvinuty nové služby a nástroje, které rozšíří nabídku služeb NDI. Bude vybudován bezpečný vstupní portál poskytující technickou a uživatelskou podporu s využitím technologie AI.
  4. Diseminace know-how do výzkumných komunit, mezi pracovníky datové podpory a obecně uživatele repozitářů, nástrojů a služeb NDI prostřednictvím komunikačních, osvětových a vzdělávacích aktivit.
  5. Širší zapojení cílových skupin do aktivit projektu OS II prostřednictvím grantového schématu minizáměry, a to zejména v oblasti zajištění FAIRifikace výzkumných dat, zajišťování standardizace/kompatiability a propojování systémů za účelem rozvoje a zajištění funkčnosti NDI.

Klíčové aktivity projektu

Klíčová aktivita 1 (KA1) Řízení projektu

Projekt je realizován žadatelem (Univerzita Karlova) ve spolupráci s 11 partnery. Realizační tým se skládá z administrativního a odborného týmu.

Administrativní tým vede Hlavní manažer projektu, který odpovídá za celkové řízení projektu, koordinaci administrativního a odborného týmu, dodržování pravidel OP JAK a naplnění cílů a rozpočtu. Projektový manažer a Finanční manažer zajišťují administrativní a finanční koordinaci na úrovni žadatele i partnerů. Administrativní pracovníci zajišťují každodenní provozní agendu.

Odborný tým je veden Odborným manažerem projektu a tvořen garanty tematických a průřezových klíčových aktivit, odbornými garanty výstupů, odbornými řešiteli a dalšími specialisty dle potřeb jednotlivých aktivit.

Nejvyšším rozhodovacím orgánem je Orgán pro vnitřní řízení projektu. Koordinaci a dohled nad realizací projektu zajišťuje Výkonný výbor projektu.

Tato struktura podporuje efektivní řízení, flexibilní reakci na změny a zajištění kvality výstupů v souladu s cíli projektu.

Klíčová aktivita 2 (KA2) Tematického clusteru Bio/zdraví/potraviny

Cílem Tematického clustru B/H/F je vybudování infrastruktury repozitářů pro správu, sdílení a opětovné využití různorodých typů biologických, chemických a klinických dat, která vznikají v základním i aplikovaném výzkumu v oblastech medicíny, biologie, chemie a příbuzných věd. Repozitářové podaktivity sdílejí společný rámec, který je pevně ukotven v principech FAIR – a to jak po stránce technické (standardizovaná metadata, přístupová rozhraní, formáty), tak procesní (kurátorství, verzování, správa oprávnění, citovatelnost).

Zásadním rysem všech vytvářených repozitářových systémů je zajištění interoperability s Národní repozitářovou platformou (NRP), využití jednotné autentizace/autorizace prostřednictvím Life Science Login a možnost exportu metadat do národních a evropských katalogů a infrastruktur. FAIRifikace není vnímána jako jednorázový výstup, ale jako průběžný a živý rámec, který umožňuje efektivní a udržitelné sdílení dat a jejich opětovné využití napříč obory i institucemi. U vybraných repozitářů je FAIRifikace dále rozšířena o přímou podporu pokročilých nástrojů pro zpracování dat (např. AI modely v chemické biologii, anotace dat pomocí ontologií).

Klíčová aktivita nepředstavuje izolovanou snahu, ale systémovou změnu v přístupu k datům v oblasti zdraví, biologie a chemie v ČR – s důrazem na mezinárodní kompatibilitu, opakovatelnost výzkumu, otevřenost a udržitelnost. Cílem je vytvořit infrastrukturu, která umožní nejen uchovávání, ale i plnohodnotné využití dat pro pokročilé výzkumné (meta)analýzy, vzdělávání, mezioborovou spolupráci a transfer znalostí.

Klíčová aktivita 3 (KA3) Tematického clusteru Materiálové vědy a technologie

V rámci této klíčové aktivity bude vytvořeno prostředí pro kvalitní správu FAIR dat výzkumu v oblasti materiálových věd a technologií v České republice. Ústřední aktivitou je zde implementace nového oborového repozitáře DANTEc s adekvátním metadatovým profilem, výběrem relevantních licencí a uživatelským prostředím, které pomůže zlepšit ukládání, ale i vyhledávání a znovuvyužití výzkumných dat. Repozitář bude napojen na nástroje pro správu dat uživateli a v rámci výzkumných infrastruktur a nástroj pro následnou práci s daty v repozitáři. Toto propojení přispěje ke zkvalitnění ukládaných oborově-specifických dat, ale i umožní široké mezioborové využití repozitáře pomocí moderních nástrojů na bázi ML a AI.

Klíčová aktivita 4 (KA4) Tematického clusteru Data management pro umělou inteligenci a strojové učení

Tematický cluster Data management pro umělou inteligenci a strojové učení zajistí tvorbu nového, oborově zaměřeného AI/ML (Artificial Intelligence/Machine Learning) repozitáře Data management pro umělou inteligenci a strojové učení založeném na repozitářovém systému CLARIN DSpace. Repozitář má za cíl nabídnout jednotnou platformu inspirovanou globální aplikací Hugging Face, která umožní efektivní sdílení a správu AI/ML modelů, datasetů a workflow a to včetně poskytnutí pokročilých nástrojů pro práci s daty a možnostmi napojení na výpočetní infrastruktury prostřednictvím LEXIS Platformy.

Klíčová aktivita 5 (KA5) Tematického clusteru Sociální vědy

V rámci Tematického clusteru Sociální vědy bude vytvořena oborová repozitářová platforma pro sociální vědy na základě inovace dvou existujících repozitářů ČSDA a DataHub doplněných o nově vybudovaný repozitář pro citlivá data. Efektivita dosažení cílů se opírá o zapojení existujících systémů do NDI EOSC v ČR a jejich doplnění o nezbytný, dosud chybějící prvek oborové infrastruktury. Komplexní prostředí pro implementaci politiky Open Science v sociálních vědách cílí jak na ukládání dat, tak na jejich opětovné využívání v sociálně-vědním a mezioborovém výzkumu. Existující systémy jsou integrované do mezinárodního ekosystému datových služeb a zároveň tak bude realizováno propojení NDI na evropskou úroveň oborové datové infrastruktury. KA se zaměří také na systematické šíření výstupů projektu a rozvoj vzdělávacích kapacit v oblasti datového managementu nejen pro odbornou komunitu v sociálních vědách. Cílem je prostřednictvím cílené komunikační strategie a nově vytvořené webové platformy zvýšit povědomí o nových službách, analýzách a vzdělávacích materiálech vzniklých v projektu.

Klíčová aktivita 6 (KA6) Tematického clusteru Fyzikální vědy

Tematický cluster Fyzikální vědy buduje specializovaný oborový repozitář „Fyzika“ založený na implementaci systému Invenio v Národní repozitářové platformě (NRP). Repozitář nabídne robustní úložiště, jasně definované metadatové modely a automatizované nástroje pro hromadný přenos a verifikaci velkých datových balíků z experimentů ATLAS ITk, DUNE, CTAO SST-1M, Auger i z krystalografické strukturní analýzy. Tím zajistí, že data vznikající dnes budou již od začátku ukládána v souladu s FAIR zásadami a budou dlouhodobě dohledatelná a použitelná pro další generace vědců.

Na technickou část navazují inovační služby: nástroj pro automatizovanou tvorbu metadat propojený s Elektronickými laboratorními deníky (ELN), webová komponenta pro přímou vizualizaci multidimenzionálních dat (HDF5/NeXus, FITS aj.) v prohlížeči a e-learningové moduly a materiály pro workshopy, které rychle rozšíří dovednosti FAIR správy dat mezi českými i mezinárodními týmy. Tyto open-source nástroje budou okamžitě využitelné také v dalších klastrech NDI a posílí interoperabilitu celé české infrastruktury.

Klíčová aktivita 7 (KA7) Tematického clusteru Humanitní vědy a umění

Klíčová aktivita 7 se zaměří na inovaci stávajících a rozvoj nových repozitářů v oborovém clusteru humanitních věd a dále pak na vývoj nástrojů a služeb pro rozvoj NDI. Repozitáře jsou soustředěny okolo čtyř existujících velkých oborových infrastruktur pro humanitní vědy jako ústředních producentů výzkumných dat a kompetenčních center v oblasti otevřené vědy v rámci clusteru (Archeologický informační systém ČR – AIS ČR, Česká literární bibliografie – ČLB, Český národní korpus – ČNK a LINDAT/CLARIAH-CZ). V aktivitě budou využita již existující repozitářová řešení, která budou u vybraných oborů s výraznou produkcí vědeckých dat případně doplněna o nové repozitáře či repozitářové komunity. Inovovány budou repozitáře:

  1. LINDAT/CLARIAH-CZ, který zapojením dat výzkumné infrastruktury ČNK, na jejichž základě vznikne samostatná kolekce/komunita repozitáře, rozšíří svou uživatelskou komunitu o obor korpusové lingvistiky
  2. Institucionální repozitář Digitalia MUNI ARTS
  3. Repozitář pro archeologii ArchaeoVault.

Nově vznikne repozitář pro bibliografická data provozovaný výzkumnou infrastrukturou Česká literární bibliografie, a to v závislosti na výsledcích interní analýzy formou samostatné kolekce/komunity v rámci některého ze stávajících repozitářů, popř. jako samostatná instance.

Klíčová aktivita 8 (KA8) Tematického clusteru Environmentální vědy

Tematický cluster Environmentální vědy se zaměří na několik bodů:

  • na tvorbu metadatových modelů, standardů a metodik umožňujících zpracovat hmotnostně spektroskopická data, fotografické záznamy pro účely studia biodiverzity, genetickou banku volně žijících organismů, zoologické sbírky, toxikologická a ekotoxikologická data a GIS data. Dále na zavedení metadatových standardů k zajištění sémantické interoperability (provázanost na řízené slovníky, thesaury a ontologie), přiřazení citovatelných persistentních identifikátorů k datovým objektům či extraktům;
  • přípravu aplikačního rozhraní pro výměnu metadat spravovaných datasetů (DCAT) a rozhraní pro výměnu dat;
  • přípravu podpůrných materiálů včetně návodů k tvorbě a validaci fairifikovaných datasetů;
  • analýzu dalších potřeb výzkumné komunity.

Ve všech případech bude řešena otázka zajištění kvality a interoperability repozitářů a dat v mezinárodním kontextu, otázka licenčních a právních modelů a napojení na externí zdroje dat.

Klíčová aktivita 9 (KA9) Tematického clusteru Citlivá data

Tematický cluster Citlivá data přidá do projektu vrstvu správy citlivých dat v celém prostoru NRP a NDI. Naváže na podporu činností nezbytných pro FAIRifikaci dat v repozitářích a práci nad licenčními a dalšími právními režimy/modely. Rozšíří současné možnosti o potřebné nástroje a funkcionality nezbytné pro správu citlivých dat. Vytvoří detailní a návodné postupy FAIRifikace citlivých dat, nástroje či služby aplikovatelné v rámci životního cyklu správy citlivých dat a v neposlední řadě se zaměří na správnou praxi sdílení a zpracování citlivých dat vyvstalých mj. i ze spolupráce mezi akademickou a soukromou sférou. TKA si klade za cíl vytvořit jasná a harmonizovaná pravidla pro zpřístupnění citlivých dat, která za stávajících podmínek nemohou být sdílena.

Klíčová aktivita 10 (KA10) Průřezová témata

Klíčová aktivita s průřezovými tématy reaguje na v současnosti zásadní výzvy v oblasti Open Science, jejichž řešení s ohledem na velmi rychlý aktuální vývoj nebylo, resp. ani nemohlo být, zahrnuto do připravované architektury projektu NRP. Projekt Open Science II je však nemůže ze své podstaty pominout a jejich řešením zásadní měrou přispěje k rozvoji NDI. Termín „průřezová témata“ je v kontextu celku projektu OS II (v poměru k oborovým KA) nutné chápat ve smyslu „komplementární“. Má-li NDI představovat jednotný/standardizovaný komplex a rozvíjející se strukturu, není možné se v současnosti vyhnout budování bezpečného vstupního portálu poskytujícího co nejširší a nejefektivnější technickou a uživatelskou podporu, kterou není možné s ohledem na očekávané množství a obsahovou šíři řešených případů vystavět a provozovat bez využití technologie AI. Důraz na kyberbezpečnost pak musí být chápán a směrován i v právních souvislostech, a to především ve vztahu k citlivým datům, a to ve všech formách a modech nakládání s nimi, přičemž nelze opomenout problémy generování a správy důvěryhodné provenance za účelem podpory zpětné a zároveň zabezpečené dohledatelnosti (traceability) předchůdců objektů uložených v repozitářích, resp. pocházejících z laboratorních deníků nebo jiného SW i mimo nich. Nedílnou součástí KA je také cílená komunikace s výzkumnými komunitami a institucemi. Efektivní sdílení informací o postupech a výsledcích projektu je klíčové pro podporu mezioborové spolupráce, zapojení odborné veřejnosti a rozšíření povědomí o nově vznikajících službách. Projekt se zaměřuje na témata jako interoperabilita výzkumných dat, přínosy FAIR principů, využitelnost služeb OS II, odborné vzdělávání a širší kontext otevřené vědy v rámci evropské iniciativy EOSC. Tato témata jsou komunikována s ohledem na potřeby jednotlivých vědeckých komunit a aktuální výzvy v oblasti datové správy.

Klíčová aktivita 11 (KA11) Minizáměry

V klíčové aktivitě bude podpořena implementace iniciativy EOSC CZ prostřednictvím výzev ke spolupráci na Minizáměry OS II. Bude realizováno kompletní grantové schéma výzev ke spolupráci.


Cílová skupina projektu

Projekt OS II je primárně zaměřen na pracovníky výzkumných organizací, kteří představují nejen hlavní tvůrce výstupů projektu, ale zároveň i jejich hlavní uživatele. Tito odborníci se aktivně podílejí na vývoji, testování a zavádění nástrojů, metodik a repozitářových služeb do praxe. Projekt tak přímo podporuje rozvoj jejich kompetencí, posiluje kapacity výzkumných organizací v oblasti správy výzkumných dat a přispívá ke zvýšení kvality a otevřenosti vědecké práce v České republice.

Projekt oslovuje široké spektrum uživatelů napříč výzkumnými institucemi, veřejnou správou, vysokoškolským a odborným vzděláváním a odbornou veřejností. Tyto skupiny se liší nejen oborovým zaměřením, ale také způsobem zapojení a mírou využívání jednotlivých výstupů projektu.

Definování všech cílových skupin projektu vychází z kvalitativního popisu, způsobu zapojení a očekávaných přínosů, přičemž jejich kvantifikace bude možná až v pozdější fázi realizace projektu na základě zpětné vazby, statistik využívání repozitářů či účasti na vzdělávacích aktivitách.


Partneři projektu

Diagram znázorňující organizační strukturu konzorcia s různými tematickými a klíčovými aktivitami, rozdělenými mezi různé univerzity a instituce.

Logo Univerzity Karlovy s červenou korunou nad modrým textem.

Kontakt

Hlavní manažer projektu OSII
Michaela Hynková
michaela.hynkova@ruk.cuni.cz

Odborný manažer projektu OSII
Jan Tuček
jan.tucek@fhs.cuni.cz

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.