Letní škola v Ostravě: AI otevírá nové možnosti také pro data stewardy

Ve dnech 3. až 5. června proběhla v Ostravě letní škola pro data stewardy, zaměřená na moderní přístupy ke správě a sdílení vědeckých dat. Účastníci rozšířili své znalosti i kontakty v rámci české komunity, která nyní čítá více než 350 členů.

13. 6. 2025 Lucie Sobková Lucie Skřičková

Bez popisku

Elektronické laboratorní deníky a Python

První den odstartovali Marek CebecauerMichal Tarana demonstrováním elektronických laboratorních deníků (ELN) – softwarového nástroje, který ve své nejzákladnější formě replikuje rozhraní podobné stránce v papírovém laboratorním zápisníku. Odpoledne pak Tomáš Martinovič navázal představením Pythonu a nástroje Rye v datové praxi.

Čištění dat a umělá inteligence

Druhý den vystoupil online Christopher Steiner z Univerzity Štýrský Hradec s tématem čištění dat pomocí LLM a OpenRefine. Upozornil, že dnešní data stewardi už nemusí umět do detailu ovládat konkrétní nástroje – místo toho by měli získat celkový přehled o různých technologiích a schopnost strategicky používat AI. Důležité je správné formulování promptů a porozumění principům fungování modelů.

V praktické části představil OpenRefine – lokální open‑source nástroj pro čištění a práci s datasety. Ukázal, jak odstranit nekonzistence, doplnit chybějící informace a využít linkování s externími zdroji, například Wikidata, což umožňuje efektivně a bezpečně rozšířit data.

Poté následovala diskuze s Janem Vališem o platformě Zenodo a konceptu „Zenodo Community“. Účastníci například řešili, jestli zakládat projektové nebo institucionální komunity a jak si poradit s praktickými výzvami spojenými s řízením datových projektů.

Program druhého dne zakončila exkurze do superpočítačového centra IT4Innovations a industriální atmosféry Dolních Vítkovic, kde měli účastníci možnost strávit volný čas networkingem.

Taking incremental steps to improve your reproducible workflow will help you to increase your skills in transparently sharing your research. The Turing Way project illustration by Scriberia. Used under a CC-BY 4.0 licence. DOI: 10.5281/zenodo.3332807.

Statistika a týmová spolupráce

Poslední den si účastníci pod vedením Lucie Hoškové vyzkoušeli praktické zpracování dat v R prostřednictvím RStudia. Program ukončil Ondřej Mottl, který přednášel o platformě GitHub a navázal tak na loňskou přednášku týkající se Version Control a Git. Mimo jiné pobavil přítomné příběhem proměny od nejistého vědce k nadšenému propagátorovi otevřené vědy. Také účastníkům detailně ukázal, jak lze efektivně propojit úkoly s konkrétními změnami v kódu (Linking a pull request to an issue - GitHub Docs). Tento způsob řízení úkolů zvyšuje přehlednost, efektivitu týmové spolupráce i transparentnost celého projektu.

Děkujeme všem účastníkům, přednášejícím i organizátorům a těšíme se na další setkání komunity data stewardů 25. září 2025 v Praze.


Fotogalerie

Foto: Školicí centrum EOSC CZ


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.