Molecular Biophysics Database: Jak funguje databáze pro biofyziky a jaký je její přínos pro výzkum?

Měření v molekulární biofyzice pomáhají vědcům porozumět tomu, jak se biomolekuly chovají, jak se jejich vlastnosti projevují v biologických procesech a jak interagují s jinými biomolekulami nebo malými molekulami, což umožňuje například vývoj léčiv cílených na konkrétní biologické mechanismy. Výsledkem těchto experimentů jsou nejen závěry publikované ve vědeckých článcích, ale také rozsáhlé soubory surových dat, které mohou mít hodnotu i dlouho po skončení původního výzkumu.

24. 6. 2026 Lucie Skřičková

Bez popisku

Aby však mohla být tato data znovu využita, nestačí je pouze uložit. Musí být srozumitelně popsaná, dohledatelná, citovatelná a dostupná v podobě, která umožňuje jejich další interpretaci. Právě k tomu slouží Molecular Biophysics Database (MBDB) - databáze pro ukládání, popis, sdílení a opětovné využívání biofyzikálních experimentálních dat.


Proč je potřeba databáze pro surová biofyzikální data

Surová experimentální data získaná pomocí technik molekulární biofyziky často obsahují informace, které mohou být důležité i pro další výzkumné týmy, nové analytické postupy nebo pozdější ověření publikovaných výsledků. V praxi však dosud nezřídka zůstávala uložená pouze lokálně, případně v obecných repozitářích bez jakýchkoli pravidel a možnosti systematického prohledávání. Tím se snižovala jejich dohledatelnost, opětovná využitelnost i možnost nezávislé kontroly.

V oboru zároveň chyběla specializovaná infrastruktura, která by umožňovala ukládat a zpřístupňovat surová data z různých experimentálních metod ve standardizované a znovu použitelné podobě. Potřeba takového řešení se začala intenzivněji diskutovat v rámci projektu evropské výzkumné infrastruktury MOSBRI (Molecular-Scale Biophysics Research Infrastructure), jejímž účastníkem byl také Biotechnologický ústav AV ČR. Zde vznikly první návrhy databáze pro biofyzikální experimentální data.

Na vývoji MBDB se podílel tým Biotechnologického ústavu AV ČR vedený Janem Dohnálkem, který stál u návrhu pilotní verze i následného rozvoje systému. Cesta k současné podobě databáze trvala několik let. Vývoj přitom nepředstavoval pouze technickou výzvu. Bylo nutné najít způsob, jak v jednom prostředí smysluplně popsat data pocházející z různých experimentálních metod, zajistit jejich vzájemnou kompatibilitu a současně zachovat dostatek detailů potřebných pro konkrétní typy měření.

Jednou z největších výzev bylo navrhnout datový model, který bude dostatečně podrobný, ale zároveň použitelný v praxi. Výsledkem je databáze, která vytváří jednotný rámec pro ukládání dat z více biofyzikálních metod, aniž by bylo nutné pro každou metodu budovat samostatný repozitář. Databáze tak propojuje principy otevřené vědy s praktickými potřebami biofyzikální komunity.


Data, metadata a metadatový model MBDB

Jednou z největších výzev bylo navrhnout datový model, který bude dostatečně podrobný, ale zároveň použitelný v praxi.

Aby bylo možné experimentální data skutečně znovu využít, nestačí uložit pouze samotný soubor z přístroje. Je potřeba vědět, co bylo měřeno, za jakých podmínek, jakým přístrojem, jak byla data zpracována a kdo za nimi stojí. Proto MBDB pracuje se třemi základními typy informací: metadaty o původu vzorků, jejich přípravě, způsobu měření a finálních výsledcích, surovými daty z přístrojů a odvozenými daty.

Surová data představují číselné údaje získané přímo z přístrojů, například množství tepla v závislosti na přidaném množství vzorku nebo změnu intenzity fluorescence v závislosti na koncentraci jedné ze složek komplexu. Odvozená měřicí data vznikají zpracováním původních dat, například po odečtení pozadí nebo transformaci dat do jiné podoby.

Klíčovou roli hrají metadata. Ta dávají datům kontext a popisují studovaný molekulární systém, použité vzorky, chemické prostředí, přístrojové nastavení, způsob analýzy, získané výsledky, ale také autory, jejich afilace, související publikace nebo zdroje financování. Výsledky představují biofyzikální parametry odvozené z měření, například disociační konstanty nebo stechiometrii vazebných partnerů. Právě metadata umožňují, aby data nebyla jen „souborem někde v databázi“, ale aby byla dohledatelná, srozumitelná a znovu použitelná.

Dalším důležitým pojmem je metadatový model, který určuje, jak mají být metadata strukturována. Zjednodušeně si jej lze představit jako promyšlenou tabulku s pojmenovanými poli, která přesně říkají, jaké informace mají být k záznamu přidány a v jaké podobě. MBDB využívá obecnou část metadatového modelu společnou pro všechny experimentální metody a specifickou část, která je pro každou metodu odlišná. Díky tomu lze v databázi vyhledávat napříč měřícími technikami a současně zachytit detailní informace potřebné pro konkrétní typ měření.


Jaké metody databáze podporuje

Právě metadata umožňují, aby data nebyla jen „souborem někde v databázi“, ale aby byla dohledatelná, srozumitelná a znovu použitelná.

MBDB se v první fázi zaměřuje na metody, pro které dosud chyběla vhodná infrastruktura pro ukládání surových dat a u nichž výzkumná komunita zároveň nejintenzivněji vnímala potřebu standardizace. V současnosti MBDB podporuje BLI (Bio-Layer Interferometry), ITC (Isothermal Titration Calorimetry), MST (Microscale Thermophoresis) a SPR (Surface Plasmon Resonance).

Vývoj databáze však pokračuje. V nejnovější veřejné verzi bude možné ukládat také data získaná metodou hmotnostní fotometrie (mass photometry) a připravuje se rozšíření o další experimentální techniky, například DSF (Differential Scanning Fluorimetry).

Důležité je, že MBDB nemá být uzavřeným technickým řešením pro několik vybraných metod. Je navržena jako rozšiřitelná databáze, která může postupně růst podle potřeb výzkumných komunit.


Praktické využití MBDB

Důležité je, že MBDB nemá být uzavřeným technickým řešením pro několik vybraných metod. Je navržena jako rozšiřitelná databáze, která může postupně růst podle potřeb výzkumných komunit.

Představme si výzkumnici, která studuje interakci mezi proteinem a malou molekulou. Provede měření, získá surová data, zpracuje je a publikuje výsledky ve vědeckém článku. Bez vhodného repozitáře by surová data často zůstala uložená pouze v laboratoři, na osobním disku nebo v interním úložišti.

Pokud je ale uloží do MBDB, doplní k nim potřebná metadata: co přesně měřila, jaké molekuly použila, v jakém chemickém prostředí proběhlo měření, jaký přístroj a jaké nastavení zvolila a jakým způsobem byla data analyzována. Záznam získá identifikátor DOI, takže může být citován podobně jako vědecký článek.

Jiní výzkumníci se k datům mohou vrátit, ověřit interpretaci výsledků, porovnat je se svými měřeními nebo je využít pro nové analytické postupy. Přínos však není jen pro ostatní. Z dobře popsaného uložení těží i samotní autoři dat. Získávají bezpečné místo, kde svá data najdou i po letech, mohou je porovnávat s dalšími experimenty a dokládat je jako samostatný citovatelný výstup svého výzkumu.

To je důležité také pro výzkumné infrastruktury poskytující výzkumným pracovníkům servisní přístup k přístrojům. Servisní laboratoře potřebují vznikající datové soubory evidovat, dlouhodobě uchovávat a v případě potřeby dokládat jejich původ, obsah i souvislost s konkrétním měřením.


Přínos pro výzkumnou komunitu

MBDB pomáhá výzkumníkům nejen ukládat data, ale také postupně sjednocovat způsob, jakým se experimentální informace v molekulární biofyzice popisují. To je důležité pro opětovné využití dat, jejich porovnávání i budoucí automatizované zpracování.

Strukturovaná data mohou v budoucnu sloužit například k systematickému porovnávání měřicích protokolů, vývoji lepších analytických nástrojů nebo využití metod strojového učení. Databáze tak nepomáhá jen jednotlivým laboratořím, ale může přispět i k tomu, aby se celé biofyzikální komunity lépe domlouvaly na standardech, kvalitě dat a způsobech jejich sdílení.


Jak lze data do MBDB vložit

Proces vkládání dat se podobá publikování vědeckého článku. Uživatel si vytvoří účet, k čemuž v současnosti potřebuje aktivní účet u služby ORCID, připraví pracovní verzi záznamu a po dokončení ji odešle ke kontrole. V připravované verzi databáze bude možné využívat také přihlašování prostřednictvím NRP AAI.

Záznamy lze vytvářet nejen prostřednictvím webového rozhraní, ale také pomocí API. To je výhodné zejména při vkládání většího množství dat nebo rozsáhlých metadat.

Databáze neposuzuje vědecký přínos měření, ale kontroluje úplnost, konzistenci a kvalitu popisu dat. Po schválení může uživatel rozhodnout, kdy záznam zveřejní. V okamžiku publikace se záznam stává veřejně dostupným a získává DOI prostřednictvím služby DataCite. Díky tomu mohou být data citována obdobně jako vědecké publikace.

MBDB klade důraz na naplňování principů FAIR a poskytuje podrobnou dokumentaci, která popisuje proces vkládání dat a metadat, datový model i kurátorské workflow. To usnadňuje jak samotné ukládání dat, tak jejich následné vyhledávání a opětovné využití.

Data lze ukládat a vyhledávat přímo na oficiálním webu MBDB. Databáze je navíc postavena na otevřených technologiích a její kód je dostupný jako open source. Molecular Biophysics Database ukazuje, jak může vypadat praktická infrastruktura pro otevřenou vědu v konkrétním oboru. Nejde jen o technické úložiště, ale o prostředí, které pomáhá dát experimentálním datům kontext, trvalou hodnotu a možnost dalšího využití.


Součást národní datové infrastruktury

Získávají bezpečné místo, kde svá data najdou i po letech, mohou je porovnávat s dalšími experimenty a dokládat je jako samostatný citovatelný výstup svého výzkumu.

MBDB je vybudována na repozitářovém systému CESNET Invenio a představuje pilotní repozitář vznikající v rámci projektu Národní repozitářová platforma pro výzkumná data (NRP). Současně je součástí Národní datové infrastruktury (NDI), jejímž cílem je poskytovat výzkumným organizacím spolehlivé služby pro správu, sdílení a dlouhodobé uchovávání výzkumných dat. MBDB tak propojuje oborově specifické potřeby molekulární biofyziky s rozvojem národní infrastruktury pro otevřenou vědu a správu výzkumných dat.

Pokud vás repozitář MBDB zajímá podrobněji, přečtěte si původní odborný článek v časopise The European Biophysics Journal.

Molecular Biophysics Database


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.