Otvorené dáta v genomike sú kľúčové — no len ak sa dajú bezpečne chrániť

Otvorený prístup k dátam posúva genomiku dopredu, ale posledné incidenty ukazujú, že dôvera sama osebe nestačí. Ak majú vedci zdieľať citlivé biologické údaje vo veľkom meradle, musia ich vedieť nielen sprístupniť, ale aj spoľahlivo chrániť pred zneužitím a únikom.

Open data is key to genomics research — if the information can be kept safe.

Zdroj: https://www.nature.com/articles/d41586-026-01475-y

V apríli sa na e-commerce platforme vlastnenej spoločnosťou Alibaba objavili na predaj de-identifikované biomedicínske údaje 500 000 účastníkov UK Biobank. Po odhalení ponuky UK Biobank, Alibaba a vlády Spojeného kráľovstva a Číny spolupracovali na tom, aby sa inzeráty odstránili ešte pred akýmkoľvek predajom. UK Biobank potom dočasne pozastavila prístup k svojej výskumnej platforme, sprísnila monitorovanie exportu dát a zakázala prístup akademickým inštitúciám, ktorým boli údaje pôvodne sprístupnené.

Podobný problém sa objavil aj v Spojených štátoch. V posledných rokoch skupina výskumníkov obišla obmedzenia a získala de-identifikované údaje od viac než 20 000 detí zapojených do štúdie Adolescent Brain Cognitive Development Study, ktorú financuje americký National Institutes of Health (NIH). Následne tieto údaje použila na podporu bielych supremacistických postojov. NIH potom sprísnil podmienky prístupu, zaviedol povinné školenie o zodpovednom používaní dát a pridal kontrolu súladu pre vedcov, ktorí chcú údaje používať.

Pre genomiku sú takéto prípady viac než len reputačný problém. Môžu odradiť ľudí od účasti v štúdiách a prinútiť inštitúcie, aby prístup k databázam ešte viac utiahli. To by však podľa autora textu spomalilo výskum, ktorý je dnes čoraz viac závislý od veľkých, dlhodobých kohort a od medzinárodne prepojených dátových súborov.

Prečo je otvorenosť v genomike taká dôležitá

Genomický výskum sa za posledné dve desaťročia výrazne rozšíril. Čoraz častejšie pracuje s rozsiahlymi kohortami, ktoré spájajú genetické údaje s podrobnými zdravotnými záznamami a sledujú státisíce účastníkov počas dlhého času. V takomto prostredí je zdieľanie dát medzi inštitúciami a krajinami základom toho, aby sa dali výsledky porovnávať, overovať a ďalej rozvíjať.

Text zároveň pripomína posun od jedného referenčného genómu, odvodeného z obmedzeného počtu ľudí, k populačným modelom. Ako príklady uvádza Human Pangenome Reference Consortium a Chinese Pangenome Consortium. Ide o širší trend v odbore: čím viac sa výskum opiera o rozmanité populácie, tým dôležitejšie je, aby boli dáta štandardizované a interoperabilné.

Ako sa genetické údaje zvyčajne zdieľajú

V bežnej praxi sa genomické dáta zdieľajú podľa dohodnutých pravidiel. Pri veľkých zdrojoch, ako je Cancer Genome Atlas, musia výskumníci predložiť návrh štúdie, etické schválenia a súhlasiť s prísnymi podmienkami používania dát. Analýza potom prebieha v rámci presne určených pravidiel správy a kontroly.

Takýto model má dve výhody. Umožňuje vedcom po celom svete testovať hypotézy a overovať zistenia. Zároveň zvyšuje transparentnosť, takže chyby aj zneužitie sa dajú odhaliť ľahšie, než keby boli údaje uzavreté v izolovaných systémoch.

Prečo odborníci upozorňujú na bezpečnosť

Prípady z UK Biobank a zo štúdie financovanej NIH ukazujú, že problémom nie je len samotný únik dát, ale aj to, ako sa s nimi po sprístupnení narába. Aj de-identifikované údaje môžu byť citlivé, ak sa dostanú mimo dohodnutých pravidiel alebo sa použijú na účely, ktoré sú v rozpore s pôvodným výskumným zámerom.

V širšom zmysle ide o dôveru medzi účastníkmi výskumu, inštitúciami a verejnosťou. Ak sa táto dôvera oslabí, môže to mať dopad na ochotu ľudí zapájať sa do štúdií, ktoré sú pre modernú genomiku nevyhnutné.

Čo znamená bezpečné zdieľanie pre budúcnosť výskumu

Autor textu tvrdí, že genomika potrebuje súčasne otvorenosť aj ochranu. To znamená nielen technické zabezpečenie, ale aj medzinárodnú spoluprácu medzi inštitúciami a vládami. Bez nej sa podľa textu môže stať, že organizácie začnú dáta uzatvárať a obmedzia využívanie medzinárodných súborov, hoci práve tie sú pre pokrok kľúčové.

V praxi to môže znamenať prísnejšie monitorovanie prenosov dát, jasnejšie pravidlá prístupu a dôslednejšie overovanie toho, kto údaje používa a na aký účel. Ide však o rovnováhu: príliš voľný prístup zvyšuje riziko zneužitia, príliš prísne bariéry zase brzdia výskum.

Čo zostáva otvorené

Text neponúka jednoduché riešenie a ani netvrdí, že existuje univerzálny model, ktorý by fungoval všade rovnako. Skôr naznačuje, že budúcnosť genomiky bude závisieť od toho, či sa podarí spojiť štandardizáciu, interoperabilitu a bezpečnosť v globálnom meradle.

Otvorenou otázkou zostáva, ako presne nastaviť pravidlá tak, aby chránili účastníkov výskumu, no zároveň nebrzdili medzinárodnú spoluprácu. Práve na tejto rovnováhe bude podľa autora stáť ďalšia fáza otvorenej vedy v genomike.


Zdroj: Nature News

Pôvodný článok: https://www.nature.com/articles/d41586-026-01475-y


Môže sa Vám ešte páčiť...

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *