Virtuálne bunky sľubujú predpovedať biológiu. Zatiaľ však narážajú na hranice dát aj modelov

Vedci sa snažia premeniť obrovské množstvá biologických dát na „virtuálne bunky“ — počítačové modely, ktoré by dokázali opísať stav bunky a predpovedať, ako zareaguje na lieky, vypnutie génu alebo iný zásah. Cieľ je ambiciózny: zrýchliť hľadanie biologických hypotéz, lepšie pochopiť choroby a naznačiť možné terapeutické zásahy. Odbor je však stále ďaleko od plnohodnotnej virtuálnej bunky, pretože skutočné bunky sú oveľa zložitejšie, než naznačuje samotné množstvo dostupných dát.

‘Virtual cells’ aim to turn raw data into predictive models of biology.

Zdroj: https://www.nature.com/articles/d41586-026-01731-1

Bunka nie je len súbor molekúl. Je to organizovaný systém s vlastnou architektúrou, v ktorom biomolekuly neustále reagujú jedna na druhú aj na podnety zvonka. Navyše neplatí, že čo funguje pre jeden typ bunky, bude platiť aj pre iný. Práve preto je modelovanie buniek náročné: nestačí zozbierať transkriptomické, proteomické či epigenetické údaje. Treba z nich vyčítať biologický význam a spojiť ich do modelu, ktorý nebude iba opisný, ale aj prediktívny.

Výskumné tímy dnes postupujú dvoma hlavnými smermi. Jeden stavia na matematických modeloch, ktoré vychádzajú zo známych biochemických a biofyzikálnych princípov. Druhý sa opiera o umelú inteligenciu, najmä o takzvané foundation models, ktoré hľadajú vzory v obrovských súboroch experimentálnych dát. Obe cesty už priniesli čiastkové úspechy, ale obe majú aj zreteľné limity.

Matematické modely majú výhodu v tom, že sa dajú interpretovať cez známe mechanizmy. Tím vedený Zaidou Luthey-Schulten napríklad v marci predstavil sofistikovaný model, ktorý realisticky napodobnil delenie buniek vo výrazne upravenej verzii baktérie rodu Mycoplasma. Iný príklad ponúka framework PhysiCell, ktorý tím Paula Macklina vyvíja viac než desať rokov. Tento simulátor slúži na modelovanie reakcií ľudských buniek a tkanív na rôzne podnety a ukázal sa ako užitočný aj pri výskume rakoviny, vrátane faktorov ovplyvňujúcich postup choroby alebo odpoveď na imunoterapiu.

Problém je v tom, že takéto modely zostávajú obmedzené tým, čo už biológia o bunke vie. A hoci projekty ako Human Cell Atlas vytvorili obrovské databázy génovej expresie a ďalších molekulárnych vrstiev, z tisícov interakcií sa biologický význam získava ťažko. Tu vstupuje do hry umelá inteligencia, ktorá sa podľa výskumníkov dobre hodí na prehľadávanie obrovského kombinatorického priestoru možných vzťahov.

Ak má mať virtuálna bunka praktický význam, nestačí, aby vedela rozpoznať základný stav konkrétneho typu bunky. Mala by vedieť aj odhadnúť, čo sa stane po zásahu — napríklad po vypnutí génu alebo po podaní liečiva. Práve preto výskumníci zdôrazňujú potrebu kauzálnych dát: experimentov, v ktorých sa systematicky mení jeden prvok a sleduje sa dôsledok.

Takéto snahy už prinášajú prvé konkrétne výsledky. Tím Yusufa Roohaniho vytvoril databázu scBaseCount, ktorá pomocou AI priebežne zhromažďuje a jednotne spracúva transkriptomické údaje pre tréning modelov. Súbor zahŕňa približne pol miliardy buniek. Na tomto základe vedci v januári opísali model Stack, z ktorého vytvorili „atlas perturbácií“ predpovedajúci účinky rôznych liekov v 28 ľudských tkanivách.

Podobne spoločnosť Xaira Therapeutics zostavila otvorene dostupný súbor X-Atlas/Pisces s dátami o génovej expresii z 25,6 milióna buniek rôznych línií po cielenom narušení génov. V marci firma predstavila model X-Cell, trénovaný práve na týchto dátach. Podľa Bo Wanga dokázal predpovedať zmeny génovej expresie spojené s aktiváciou imunitných T buniek, hoci na tomto procese nebol priamo trénovaný. Výskumníkom to umožnilo navrhnúť mechanizmy, ktoré by takúto aktiváciu mohli vypnúť, čo by mohlo byť užitočné pri zápalových a iných imunitných poruchách. Zároveň však sám Wang upozorňuje, že ide iba o skoré kroky.

Praktický význam týchto modelov je zrejmý. Ak by spoľahlivo predpovedali, ktoré genetické poruchy poháňajú rast konkrétneho nádoru alebo aký typ liečiva stabilizuje narušený bunkový metabolizmus, mohli by výrazne urýchliť biomedicínsky výskum. Namiesto zdĺhavého testovania nespočetných možností v laboratóriu by vedci najprv zúžili priestor kandidátov in silico a až potom by overovali najsľubnejšie hypotézy experimentálne.

Napriek pokroku zostáva oblasť ďaleko od stavu, keď by bolo rozumné hovoriť o skutočne funkčnej virtuálnej bunke. Súčasné modely vedia pomerne dobre zachytiť statické stavy buniek, no podstatne slabšie si radia s dynamickými zmenami. Navyše sa často opierajú o bunkové línie, ktoré predstavujú jednoduchšie biologické systémy než reálne orgány a tkanivá. Získavať dostatok tréningových dát z primárnych buniek priamo z ľudských vzoriek vo veľkom meradle je oveľa ťažšie.

Ukazuje sa aj ďalší problém: nie je isté, že čisto AI prístupy sú dnes automaticky lepšie než jednoduchšie matematické alebo štatistické metódy. V rámci Virtual Cell Challenge, ktorú Arc Institute usporiadal v roku 2025, sa síce zapojili tisíce účastníkov z viac ako stovky krajín, no modely založené výlučne na AI neprekonali riešenia, ktoré kombinovali umelú inteligenciu s konvenčnými štatistickými postupmi.

Dôležitou prekážkou je aj samotná povaha dát. Jednobunkové RNA sekvenovanie je šumové a drobné, biologicky významné zmeny sa v ňom môžu stratiť v pozadí experimentálnych artefaktov alebo prirodzenej variability medzi vzorkami. Aj preto vznikajú nové nástroje na hodnotenie modelov. Maria Brbić a jej kolegovia napríklad v roku 2025 predstavili benchmarkingový nástroj Systema, ktorý má pomôcť odfiltrovať šum a sústrediť sa na zmeny špecificky vyvolané perturbáciou. Podobným smerom ide aj model State od Roohaniho tímu. Keď sa skombinoval s metrikou zameranou práve na perturbáciou vyvolané efekty, dokázal v testovacích dátach správne predpovedať približne tretinu génov najvýraznejšie ovplyvnených daným zásahom. Bežné metódy dosahovali asi 7 %.

To je povzbudivý posun, ale nie dôkaz, že problém je vyriešený. Skôr naznačuje, že budúce virtuálne bunky zrejme nevzniknú iba z väčších dátových súborov alebo iba z výkonnejšej AI. Budú potrebovať kombináciu kvalitných meraní, lepších spôsobov spájania rôznych typov dát a modelov, ktoré nielen rozpoznajú vzory, ale aj zachytia skutočné biologické príčiny a dôsledky.

Čo si pod pojmom virtuálna bunka predstaviť

Virtuálna bunka nie je jedna konkrétna technológia ani jeden hotový softvér. V širšom zmysle ide o výpočtový model, ktorý sa snaží čo najvernejšie opísať vnútorné fungovanie bunky. V ideálnom prípade by takýto model vedel zachytiť jej bežný stav a potom simulovať, čo sa zmení po zásahu zvonka alebo po genetickej zmene.

Paul Macklin presenting to a room with a projected image of a 3D virtual tissue.

Snímka zobrazuje: Paul Macklin demonstrating 3D tumour-immune simulations, Indiana University. Credit: Photo courtesy of Indiana University.

Zdroj: https://www.nature.com/articles/d41586-026-01731-1

V praxi to znamená prepojiť viacero vrstiev biologickej informácie — od génovej expresie cez proteíny až po signálne dráhy či metabolizmus. Práve toto prepojenie je mimoriadne náročné. Zdrojový článok ukazuje, že vedci zatiaľ stavajú skôr čiastkové modely, ktoré fungujú v obmedzených situáciách, než univerzálnu digitálnu kópiu skutočnej bunky.

Prečo samotné veľké dáta nestačia

Biológia dnes produkuje obrovské množstvo dát a môže sa zdať, že stačí „nasýtiť“ nimi model. Lenže veľký objem ešte automaticky neznamená dobré porozumenie. Údaje z génovej expresie hovoria o tom, ktoré gény sú aktívne, ale samy osebe ešte nevysvetľujú, prečo sa bunka správa určitým spôsobom.

Portrait of Maria Brbić outside.

Snímka zobrazuje: Maria Brbić uses artificial intelligence to incorporate transcriptome data into virtual cells. Credit: Maria Brbić.

Zdroj: https://www.nature.com/articles/d41586-026-01731-1

Zdroj zdôrazňuje aj problém šumu. Najmä pri jednobunkových dátach sa mieša skutočný biologický signál s technickými odchýlkami a prirodzenou variabilitou. Ak model nerozlíši podstatnú zmenu od nepodstatného pozadia, jeho predpovede môžu vyzerať presvedčivo, no biologicky nemusia veľa znamenať.

Matematické modely verzus umelá inteligencia

V tomto odbore sa čoraz viac stretávajú dva výskumné prístupy. Mechanistické matematické modely vychádzajú z toho, čo už vedci poznajú o biochemických procesoch. Ich výhodou je lepšia interpretovateľnosť: ak model niečo predpovie, výskumník vie ľahšie sledovať, z akých predpokladov to vyplýva.

Modely umelej inteligencie sú naopak silné v hľadaní vzorov vo veľmi rozsiahlych a zložitých dátach. Môžu objaviť súvislosti, ktoré by sa klasickými postupmi hľadali ťažko. Zdroj však zároveň ukazuje, že ani jeden prístup dnes nestačí sám osebe. Najlepšie výsledky zatiaľ často prináša kombinácia AI s tradičnejšími štatistickými a biologicky ukotvenými metódami.

Kde by virtuálne bunky mohli pomôcť medicíne

Ak sa tieto modely zlepšia, ich najväčší význam môže byť v predbežnom testovaní hypotéz. Namiesto toho, aby laboratóriá skúšali obrovské množstvo génových zásahov a liekov naslepo, mohli by najprv počítačovo odhadnúť, ktoré možnosti majú najväčší zmysel.

Takýto prístup by mohol pomôcť napríklad pri výskume nádorov, imunologických porúch či metabolických ochorení. Dôležité je však držať sa pri zemi: zdroj nehovorí, že by dnešné virtuálne bunky boli pripravené nahradiť experimenty alebo klinický vývoj. Skôr by sa mohli stať nástrojom, ktorý pomôže výskum lepšie nasmerovať.

Čo ešte chýba k skutočne prediktívnym modelom

Najväčšou otvorenou otázkou zostáva, ako modelovať dynamiku života v bunke tak, aby predpovede fungovali aj mimo úzko definovaných tréningových podmienok. Bunka sa neustále mení v čase, reaguje na prostredie a funguje v kontexte tkaniva či celého organizmu. To sa zachytáva podstatne ťažšie než statický molekulový profil.

Ďalším krokom preto nebude len zber ešte väčších databáz, ale aj dôslednejšie experimenty zamerané na príčiny a následky, lepšie porovnávacie testy modelov a kvalitnejšie údaje z primárnych ľudských buniek. Až potom sa ukáže, do akej miery sa z dnešných sľubných nástrojov stanú modely, ktoré budú vedieť biologické správanie spoľahlivo predpovedať, nielen spätne opisovať.


Zdroj: Nature News

Pôvodný článok: https://www.nature.com/articles/d41586-026-01731-1


Môže sa Vám ešte páčiť...

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *