Infrastruktura nestačí. Otevřená věda vyžaduje kulturní změnu

Jak může umělá inteligence pomoci vědcům lépe využít vzácný čas měření na synchrotronu? A proč jsou metadata, databáze a principy FAIR stále důležitější i v moderním výzkumu materiálů? V rozhovoru s Ridhou Eddhibe, výzkumníkem z Nových technologií – výzkumného centra Západočeské univerzity v Plzni, mluvíme o strojovém učení, fotoemisní spektroskopii, 2D materiálech i rostoucím významu správy výzkumných dat ve fyzice.

4. 5. 2026 Lucie Skřičková

Bez popisku

Z Tuniska do Plzně

Jaká byla vaše cesta k výzkumu a co vás přivedlo do České republiky, konkrétně na Západočeskou univerzitu v Plzni a do centra NTC?

Všechna vysokoškolská studia jsem absolvoval v Tunisku a doplnil je o mezinárodní stáže v Německu a Turecku. Moje akademická cesta začala studiem základní fyziky, kde jsem se poprvé setkal s kvantovou mechanikou a fyzikou pevných látek — tedy s představou, že částice, které nevidíme, určují vlastnosti všeho kolem nás. Byla to láska na první pohled.

Později jsem se zaměřil na materiálové vědy a fyziku nanostruktur, které stojí v pozadí mnoha moderních technologií. Moje diplomová práce mě přivedla k úhlově rozlišené fotoemisní spektroskopii, tedy ARPES — jedné z mála metod, která umožňuje přímo zkoumat elektronovou strukturu materiálů. Právě této oblasti se věnuje profesor Jan Minár, jeden z jejích předních odborníků. Jeho skupina v centru Nové technologie – výzkumné centrum Západočeské univerzity v Plzni je výjimečná tím, že propojuje pokročilé teoretické přístupy s experimentálním výzkumem. Díky doktorandskému programu sítě EUSpecLab Marie Skłodowska-Curie jsem se do ní dostal i já. Je to mimořádná zkušenost.


Vaše práce propojuje strojové učení a fotoemisní spektroskopii, zejména v oblasti 2D materiálů. Mohl byste přiblížit, na čem aktuálně pracujete a proč je tento výzkum důležitý?

V současné práci využívám strojové učení k řešení velmi praktické experimentální výzvy: jak v reálném čase kalibrovat polarizaci fotonového svazku při synchrotronových měřeních ARPES.

Čas na synchrotronu je mimořádně cenný a omezený. Vědci často získají jen několik dní měření ročně, takže záleží na každé minutě. Přesto se značná část tohoto času může ztratit ruční kalibrací polarizace, aniž by bylo jisté, že jsou podmínky skutečně optimální.

Na podporu této práce jsme vyvinuli SparkkFLOW, který automatizuje simulační workflow, a OSCARpes, specializovanou databázi pro výsledky one-step fotoemise. Tyto nástroje nám pomáhají vytvářet čistá, škálovatelná a dobře strukturovaná trénovací data. Praktický přínos je zřejmý: místo hodin strávených ruční kalibrací mohou výzkumníci nastavovat experiment dynamicky a omezený čas měření věnovat samotné vědě.


AI nejen ve fyzice

Jak dnes umělá inteligence proměňuje výzkum ve fyzice kondenzovaných látek a způsob analýzy experimentálních dat?

Umělá inteligence mění fyziku kondenzovaných látek ve dvou hlavních směrech. V teorii urychluje objevování nových materiálů: modely dokážou prověřit tisíce kandidátních sloučenin a předpovídat jejich elektronové vlastnosti mnohem rychleji než tradiční výpočty z prvních principů. Práce, která dříve trvala roky, se tak může zkrátit na dny.

Na experimentální úrovni je dopad možná ještě větší. Synchrotronová zařízení a měření ARPES produkují obrovské objemy dat, které není možné během měření ručně procházet. AI umožňuje analyzovat data v reálném čase, rozpoznávat vzory a odhalovat anomálie už v průběhu experimentu. Vědci se tak mohou rozhodovat okamžitě, ne až týdny později při zpracování výsledků.

Za nejzajímavější považuji propojení obou světů: modely trénované na kvalitních teoretických simulacích lze následně využít přímo v experimentu. V našem případě tak simulace pomáhají vytvořit AI nástroj, který dokáže v reálném čase podpořit nastavení měření. Právě v tomto propojení výpočtů, umělé inteligence a experimentu vidím největší potenciál.


Data, metadata a kulturní změna v open science

Ve své práci pracujete s komplexními datovými sadami. Jaké jsou podle vás hlavní výzvy v jejich správě, dlouhodobém ukládání a sdílení?

„Tyto nástroje nám pomáhají vytvářet čistá, škálovatelná a dobře strukturovaná trénovací data. Praktický přínos je zřejmý: místo hodin strávených ruční kalibrací mohou výzkumníci nastavovat experiment dynamicky a omezený čas měření věnovat samotné vědě.“

S tím se potýkám každý den a často se to podceňuje. Naše simulace generují rozsáhlé, vícerozměrné datové sady. Každá z nich je navázána na konkrétní fyzikální parametry, výpočetní nastavení a kritéria konvergence. První výzvou je jednoduše udržet přehled o tom, co už bylo spočítáno.

Bez odpovídající infrastruktury rychle vznikají duplicitní výpočty, chybějící metadata a výsledky, které už po šesti měsících nelze reprodukovat. Právě proto jsme vytvořili OSCARpes, strukturovanou databázi navrženou k indexaci, deduplikaci a poskytování výsledků one-step fotoemise s úplnou proveniencí. Může to znít spíš jako inženýrská práce než fyzika, ale bez této vrstvy nelze vědu škálovat.

Další výzvou je dlouhodobé ukládání. Akademické skupiny často spoléhají na lokální servery nebo institucionální clustery, kde není vždy zajištěna dlouhodobá dostupnost. Když doktorand odejde, důležitá data mohou prakticky zmizet.

Obor se postupně posouvá směrem k principům FAIR, avšak v praxi je jejich přijímání stále pomalé, mimo jiné proto, že vyžaduje práci navíc už na začátku a nevede vždy přímo k publikacím.

Sdílení je možná nejvíce kulturní výzvou. Fyzika kondenzovaných látek často stále funguje tak, že se data sdílejí až při publikaci článku, pokud vůbec. Pokud ale chceme, aby přístupy založené na AI skutečně fungovaly, potřebujeme velké, dobře kurátorované a dostupné datové sady. Simulace jedné skupiny může jiné skupině ušetřit měsíce výpočtů, ale jen tehdy, pokud jsou data strukturovaná a znovu použitelná.

Tyto problémy možná nezní příliš atraktivně, ale bez kvalitní datové infrastruktury nelze podobné přístupy dlouhodobě rozvíjet. Fyzika a algoritmy postupují rychle kupředu a práce s daty s nimi musí držet krok.


Vnímáte rozdíly v přístupu k výzkumným datům a otevřené vědě mezi různými zeměmi, například mezi Českou republikou, Evropou obecně a Tuniskem?

Ano, rozdíly jsou poměrně viditelné. Na evropské úrovni se EOSC stává klíčovým prostředím pro publikování, vyhledávání a opětovné využívání výzkumných dat napříč státy i obory. Pro náš obor jsou důležité také projekty jako PaNOSC, které do tohoto ekosystému zapojují velká synchrotronová a neutronová zařízení.

V materiálových vědách je velmi pokročilé Německo. FAIRmat, jedno z konsorcií NFDI, zastupuje komunitu fyziky kondenzovaných látek a chemické fyziky a staví na platformě NOMAD, jedné z největších datových infrastruktur pro výpočetní materiálové vědy. V mém výzkumném prostředí je to přesně typ infrastruktury, která dělá FAIR data prakticky využitelnými.

V České republice vnímám, že se věci začínají výrazně posouvat. EOSC CZ pomáhá budovat národní infrastrukturu pro FAIR data a v rámci Open Science II vzniká specializovaný repozitář DANTEc zaměřený na materiálové vědy a technologie. Právě podobná oborová řešení mohou výzkumníkům výrazně usnadnit praktické využívání FAIR principů.

V Tunisku se začíná posilovat napojení na globální výzkumnou infrastrukturu, například prostřednictvím persistentních identifikátorů a spolupráce s DataCite. V zemi je silná odborná komunita a její propojení s evropskými platformami, jako jsou NOMAD nebo EOSC, by mohlo další vývoj výrazně urychlit.

I tam, kde už infrastruktura existuje, je ale její adopce stále pomalá. Zavedené pracovní postupy se nemění ze dne na den. Platformy se budují, ale skutečná změna je kulturní — a ta vyžaduje čas v každé zemi.


Jste členem pracovní skupiny EOSC CZ zaměřené na metadata a fyzikální vědy. Jak důležitá jsou kvalitní metadata pro znovupoužitelnost dat a mezioborovou spolupráci?

„Sdílení je možná nejvíce kulturní výzvou. Fyzika kondenzovaných látek často stále funguje tak, že se data sdílejí až při publikaci článku, pokud vůbec. Pokud ale chceme, aby přístupy založené na AI skutečně fungovaly, potřebujeme velké, dobře kurátorované a dostupné datové sady. Simulace jedné skupiny může jiné skupině ušetřit měsíce výpočtů, ale jen tehdy, pokud jsou data strukturovaná a znovu použitelná.“

Metadata jsou naprosto zásadní. Bez nich jsou data jen čísla v souboru, která nikdo jiný, a často ani původní autor po několika měsících, nedokáže správně interpretovat.

Ve fotoemisní spektroskopii například samotné spektrum nestačí. Aby bylo možné data znovu použít, musí být jasné, za jakých podmínek vznikla — s jakým nastavením, parametry a výpočetním modelem. Pokud tyto informace chybí, data nelze spolehlivě reprodukovat, porovnat ani dále využít. Právě proto jsme databázi OSCARpes od začátku navrhovali se strukturovanými metadaty.

Práce v EOSC CZ mi ukazuje, jak náročné je nastavit metadata tak, aby byla užitečná napříč obory. To, co je zásadní pro fyzika, nemusí být stejně důležité pro biologa nebo sociálního vědce. Skutečnou výzvou proto není jen vytvořit standardy, ale také v tom, jak přesvědčit výzkumníky, aby je začali používat ve svých každodenních pracovních postupech. A tím se znovu dostáváme ke kulturní změně, kterou otevřená věda vyžaduje.


Měl jste možnost setkat se s několika laureáty Nobelovy ceny, včetně sira Konstantina Novoselova. Ovlivnila tato setkání vaše další vědecké směřování?

Rozhodně ano. Setkání se Sirem Konstantinem Novoselovem mi připomnělo, že i materiál, jako je grafen, o kterém už toho věda ví opravdu hodně, stále skrývá nové otázky. Posílilo to moje přesvědčení, že výzkum 2D materiálů má před sebou ještě velký prostor.

Velmi silné pro mě bylo také setkání s Anne L’Huillier. Její práce ukazuje, že se můžeme dostat až k pozorování pohybu elektronů v reálném čase. To je pro mě fascinující představa: nejen vědět, jak materiál vypadá na elektronové úrovni, ale sledovat, co se v něm skutečně děje. Právě tímto směrem bych se chtěl ve své další práci ubírat.


„Metadata jsou naprosto zásadní. Bez nich jsou data jen čísla v souboru, která nikdo jiný, a často ani původní autor po několika měsících, nedokáže správně interpretovat.“

Bez popisku

Ridha Eddhib


pochází z Tuniska, kde vystudoval vysokou školu v Kartágu, a následně absolvoval stáž na Universität Rostock v Německu. V současnosti působí v centru Nové technologie – výzkumném centru Západočeské univerzity v Plzni. Specializuje se na fyziku kondenzovaných látek, strojové učení a pokročilé spektroskopické metody, zejména v oblasti 2D materiálů. Na NTC je zapojen do evropské doktorandské sítě EUSpecLab, financované z programu Marie Skłodowska-Curie, která propojuje univerzity a firmy napříč Evropou. Ve výzkumu se věnuje využití strojového učení pro modelování a rozvoj moderních metod fotoemisní spektroskopie, včetně experimentů souvisejících se SARPES a 2D materiály.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.