Představme si výzkumnici, která studuje interakci mezi proteinem a malou molekulou. Provede měření, získá surová data, zpracuje je a publikuje výsledky ve vědeckém článku. Bez vhodného repozitáře by surová data často zůstala uložená pouze v laboratoři, na osobním disku nebo v interním úložišti.
Pokud je ale uloží do MBDB, doplní k nim potřebná metadata: co přesně měřila, jaké molekuly použila, v jakém chemickém prostředí proběhlo měření, jaký přístroj a jaké nastavení zvolila a jakým způsobem byla data analyzována. Záznam získá identifikátor DOI, takže může být citován podobně jako vědecký článek.
Jiní výzkumníci se k datům mohou vrátit, ověřit interpretaci výsledků, porovnat je se svými měřeními nebo je využít pro nové analytické postupy. Přínos však není jen pro ostatní. Z dobře popsaného uložení těží i samotní autoři dat. Získávají bezpečné místo, kde svá data najdou i po letech, mohou je porovnávat s dalšími experimenty a dokládat je jako samostatný citovatelný výstup svého výzkumu.
To je důležité také pro výzkumné infrastruktury poskytující výzkumným pracovníkům servisní přístup k přístrojům. Servisní laboratoře potřebují vznikající datové soubory evidovat, dlouhodobě uchovávat a v případě potřeby dokládat jejich původ, obsah i souvislost s konkrétním měřením.
Přínos pro výzkumnou komunitu
MBDB pomáhá výzkumníkům nejen ukládat data, ale také postupně sjednocovat způsob, jakým se experimentální informace v molekulární biofyzice popisují. To je důležité pro opětovné využití dat, jejich porovnávání i budoucí automatizované zpracování.
Strukturovaná data mohou v budoucnu sloužit například k systematickému porovnávání měřicích protokolů, vývoji lepších analytických nástrojů nebo využití metod strojového učení. Databáze tak nepomáhá jen jednotlivým laboratořím, ale může přispět i k tomu, aby se celé biofyzikální komunity lépe domlouvaly na standardech, kvalitě dat a způsobech jejich sdílení.
Jak lze data do MBDB vložit
Proces vkládání dat se podobá publikování vědeckého článku. Uživatel si vytvoří účet, k čemuž v současnosti potřebuje aktivní účet u služby ORCID, připraví pracovní verzi záznamu a po dokončení ji odešle ke kontrole. V připravované verzi databáze bude možné využívat také přihlašování prostřednictvím NRP AAI.
Záznamy lze vytvářet nejen prostřednictvím webového rozhraní, ale také pomocí API. To je výhodné zejména při vkládání většího množství dat nebo rozsáhlých metadat.
Databáze neposuzuje vědecký přínos měření, ale kontroluje úplnost, konzistenci a kvalitu popisu dat. Po schválení může uživatel rozhodnout, kdy záznam zveřejní. V okamžiku publikace se záznam stává veřejně dostupným a získává DOI prostřednictvím služby DataCite. Díky tomu mohou být data citována obdobně jako vědecké publikace.
MBDB klade důraz na naplňování principů FAIR a poskytuje podrobnou dokumentaci, která popisuje proces vkládání dat a metadat, datový model i kurátorské workflow. To usnadňuje jak samotné ukládání dat, tak jejich následné vyhledávání a opětovné využití.
Data lze ukládat a vyhledávat přímo na oficiálním webu MBDB. Databáze je navíc postavena na otevřených technologiích a její kód je dostupný jako open source. Molecular Biophysics Database ukazuje, jak může vypadat praktická infrastruktura pro otevřenou vědu v konkrétním oboru. Nejde jen o technické úložiště, ale o prostředí, které pomáhá dát experimentálním datům kontext, trvalou hodnotu a možnost dalšího využití.
Součást národní datové infrastruktury