Používání citlivých dat v AI je bezpochyby velmi aktuální téma. Vývoj právního rámce Evropského prostoru pro zdravotní data (EHDS) pomůže zajistit právní základ pro využívání zdravotních dat i bez výslovného souhlasu subjektu. Zpřístupnění rozsáhlých souborů zdravotnických dat usnadní výzkum, ale stále narážíme na překážky při jejich sdílení a kombinování v mezinárodním prostředí. Důležitou roli v tomto směru mohou sehrát výzkumné infrastruktury, které už dnes pracují s kvalitními daty a umožňují jejich bezpečné sdílení v mezinárodních projektech. Právě díky nim může Evropa držet krok s konkurencí ze zemí, kde platí méně přísná pravidla a kde se rychleji vyvíjejí základní AI modely s potenciálem zásadně proměnit současné postupy. Aby Evropa v této oblasti uspěla, bude nezbytné vybudovat federované infrastruktury, které budou nejen bezpečné, ale i výkonné, spolehlivé a snadno použitelné.
Samozřejmě existují standardy pro získávání, kódování, formátování a přenos dat. A možná jich je dokonce až příliš. Méně standardizovaná je však oblast harmonizace nestrukturovaných dat, jako jsou právě medicínské snímky. I když jsou tato data technicky dobře strukturovaná, vznikají podle standardních protokolů a běžně se u nich používají osvědčené postupy pro práci s metadaty, mohou se mezi nimi vyskytovat rozdíly – například v typu přístroje, jeho výrobci, zdravotním stavu pacienta nebo v postupu konkrétního operátora. Tyto odchylky si člověk často ani nevšimne, ale pro modely umělé inteligence mohou znamenat zásadní problém. To je obzvlášť důležité ve federovaných systémech, kde není možné data analyzovat jako celek. Klíčové proto bude hodnotit kvalitu dat, umět kvantifikovat odlišnosti v nestrukturovaných údajích a přesně popsat, odkud data pocházejí a jak byla předzpracována. Jen tak zajistíme, že budou data reprodukovatelná a opakovaně použitelná.