Nová štatistika D* má presnejšie hľadať lokálnu introgresiu v starovekej DNA

Hľadanie dávnych genetických prímesí je často práca s neúplným, poškodeným a nerovnomerne vzorkovaným materiálom. Nová metóda označená ako D* sa snaží riešiť práve tento problém: lepšie rozpoznať krátke úseky DNA, ktoré mohli prejsť medzi príbuznými, no nesesterskými populáciami.

amphitheater, colosseum, ancient, stadium, architecture, monument, archaeology, ruin, travel, croatia, pula, arena, historic, historical, old, archaeological, colosseum, pula, pula, pula, pula, pula

Snímka zobrazuje: amphitheater, colosseum, ancient, stadium, architecture, monument, archaeology, ruin, travel, croatia, pula, arena, historic, historical, old,.

Zdroj: https://pixabay.com/photos/amphitheater-colosseum-ancient-3246853/

Štúdia zverejnená na bioRxiv a evidovaná v databáze PubMed predstavuje metódu D STatistic with Allelic Rarefaction, skrátene D*. Autormi sú T Quinn Smith a Zachary A Szpiech. Práca nadväzuje na Pattersonovu D štatistiku, známu aj ako ABBA-BABA štatistika, ktorá sa široko používa na zisťovanie archaickej genómovej introgresie medzi dvoma nesesterskými taxónmi.

Pattersonovo D pracuje s jednou líniou zo štyroch taxónov, pričom jeden z nich slúži ako outgroup na určenie pôvodnej alely. Metóda sleduje nerovnováhu medzi počtom bialelických miest, na ktorých zdieľajú alely rôzne dvojice taxónov. Ak k introgresii nedošlo, očakáva sa, že tieto počty budú vyrovnané. Odchýlka môže naznačovať prenos genetického materiálu z tretieho taxónu do prvého alebo druhého.

Podľa autorov má však Pattersonovo D dôležité obmedzenie: je vhodné najmä na detekciu genómovej introgresie ako celku a pri menších genómových úsekoch môže vykazovať vysokú mieru falošne pozitívnych výsledkov. Práve na lokálne introgressované segmenty DNA sa zameriava navrhovaná metóda D*.

D* používa viacero línií a na výpočet nerovnováhy nevyžaduje outgroup. Namiesto toho porovnáva počet alel nachádzajúcich sa výlučne v druhom a treťom taxóne s počtom alel nachádzajúcich sa výlučne v prvom a treťom taxóne. Metóda zároveň využíva rarefaction, teda techniku vzácnenia, aby korigovala nerovnakú veľkosť vzoriek, a umožňuje pracovať aj s multialelickými miestami.

Autori uvádzajú, že v simuláciách mala D* lepšiu precision a recall pri detekcii introgressovaných segmentov DNA než podobné metódy, a to pri širokej škále modelových parametrov aj za prítomnosti technických artefaktov bežných pri analýzach starovekej DNA. Práca sa končí analýzou denisovanskej DNA introgresie u súčasných Papuáncov. Predkompilované programy, manuál aj zdrojový kód sú dostupné na GitHube v repozitári DSTAR.

Keďže ide o záznam z bioRxiv, text treba čítať ako preprintový výskum. To neoslabuje technický význam navrhnutej metódy, no výsledky a ich porovnania budú prirodzene predmetom ďalšieho preverovania, používania a diskusie v odbornej komunite.

Ako funguje Pattersonovo D

Vo všeobecnosti sa Pattersonovo D používa v populačnej genetike na testovanie toho, či sú určité vzory zdieľaných alel medzi populáciami v súlade s jednoduchým vetvením, alebo naznačujú dodatočný tok génov.

marquee, column, antique, romans, archaeology, pompei, ruins, ancient ruins

Snímka zobrazuje: marquee, column, antique, romans, archaeology, pompei, ruins, ancient ruins.

Zdroj: https://pixabay.com/photos/marquee-column-antique-romans-2467138/

Zjednodušene povedané, ak sa dve kategórie genetických vzorov objavujú v podobnej miere, dáta môžu zodpovedať stromovému modelu bez introgresie. Ak je jedna kategória výrazne častejšia, môže to byť signál, že medzi líniami prebehol genetický prenos.

Sila tejto štatistiky spočíva v jej relatívnej jednoduchosti. Nepotrebuje kompletný populačný model a pracuje s porovnaním alelických vzorov. Práve preto sa stala užitočným nástrojom pri štúdiu archaickej introgresie. Zároveň však podľa zdrojovej práce nie je ideálna na malé segmenty genómu, kde môže viesť k falošne pozitívnym záverom.

Čo mení metóda D*

Nová metóda D* sa snaží posunúť analýzu z úrovne celogenómového signálu k lokálnejším úsekom DNA.

knossos, crete, archaeology, temple, ruin, greece, ancient, reliefpithos, clay pot, clay jug, amphora, knossos, knossos, knossos, knossos, knossos, clay pot, amphora

Snímka zobrazuje: knossos, crete, archaeology, temple, ruin, greece, ancient, reliefpithos, clay pot, clay jug, amphora, knossos, knossos, knossos, knossos, knossos,.

Zdroj: https://pixabay.com/photos/knossos-crete-archaeology-temple-3527395/

Zdrojový text zdôrazňuje dve zásadné zmeny: využitie viacerých línií a odstránenie potreby outgroup pri samotnom výpočte nerovnováhy.

To je prakticky dôležité najmä v situáciách, keď výber vhodného outgroup nie je priamočiary alebo keď dostupné dáta nie sú ideálne vyvážené. D* sa zameriava na alely zdieľané výlučne medzi konkrétnymi dvojicami taxónov a z tejto nerovnováhy odvodzuje signál možnej introgresie. Podľa autorov navyše dokáže pracovať aj s multialelickými miestami, čo rozširuje typ dát, ktoré možno do analýzy zahrnúť.

Prečo je vzácnenie dôležité

Rarefaction, po slovensky často opisovaná ako vzácnenie, je štatistický prístup používaný vtedy, keď porovnávané súbory nemajú rovnakú veľkosť.

maya, mayan, ancient, mexico, culture, stone, yucatan, mexican, civilization, archeology, ruin, archaeology, archaeological, brown culture, brown stone, maya, maya, maya, maya, maya, mayan, mayan, mayan, mayan, mexico, mexico, yucatan

Snímka zobrazuje: maya, mayan, ancient, mexico, culture, stone, yucatan, mexican, civilization, archeology, ruin, archaeology, archaeological, brown culture, brown.

Zdroj: https://pixabay.com/photos/maya-mayan-ancient-mexico-culture-542096/

V genetických dátach môže nerovnaký počet vzoriek alebo línií skresliť to, koľko alel sa javí ako výlučných pre jednu či druhú skupinu.

V prípade D* má vzácnenie podľa autorov korigovať práve nerovnakú veľkosť vzoriek. V širšom metodologickom kontexte ide o snahu, aby rozdiel medzi porovnávanými skupinami nebol iba dôsledkom toho, že jedna skupina bola odobratá alebo sekvenovaná rozsiahlejšie než druhá. Pri starovekej DNA je takáto opatrnosť obzvlášť relevantná, pretože kvalita aj množstvo genetického materiálu môžu byť veľmi nerovnomerné.

Význam pre starovekú DNA a archeogenetiku

Staroveká DNA často prináša otázky, ktoré nemožno vyriešiť len porovnaním celých genómov.

jordan, jerash, pretty much, ruin, pillar, ancient, temple, roman, archaeology, historical, architecture, decapolis, theatre, outlook, stage, jordan, jordan, jordan, jordan, jordan, jerash, jerash

Snímka zobrazuje: jordan, jerash, pretty much, ruin, pillar, ancient, temple, roman, archaeology, historical, architecture, decapolis, theatre, outlook, stage, jordan,.

Zdroj: https://pixabay.com/photos/jordan-jerash-pretty-much-ruin-4688350/

Výskumníkov zaujíma aj to, kde presne sa v genóme nachádzajú segmenty pochádzajúce z dávneho miešania populácií a ako ich odlíšiť od šumu, poškodenia alebo technických artefaktov.

Zdrojová štúdia uvádza, že D* bola testovaná v simuláciách aj v prítomnosti technických artefaktov typických pre analýzy starovekej DNA. To je dôležité, pretože staré vzorky bývajú fragmentované a môžu niesť poškodenia, ktoré komplikujú interpretáciu. Ak metóda dokáže lepšie rozlišovať introgressované segmenty v takýchto podmienkach, môže byť užitočná pre archeogenetické otázky o dávnych kontaktoch medzi populáciami.

Čo zostáva otvorené

Autori v zdrojovom texte uvádzajú lepšie výsledky D* v simuláciách v porovnaní s podobnými metódami a prikladajú aj analýzu denisovanskej introgresie u dnešných Papuáncov.

petra, ruin, man, sitting, arabic, jordan, nature, desert, stone, travel, vacations, ruins, ancient, excavation, culture, archaeology

Snímka zobrazuje: petra, ruin, man, sitting, arabic, jordan, nature, desert, stone, travel, vacations, ruins, ancient, excavation, culture, archaeology.

Zdroj: https://pixabay.com/photos/petra-ruin-man-sitting-arabic-4791892/

Zároveň však samotný charakter preprintu znamená, že metóda bude potrebovať ďalšie nezávislé používanie, porovnávanie a testovanie na rôznych typoch dát.

Otvorené zostáva najmä to, ako sa D* bude správať v širokej praxi mimo modelových scenárov uvedených v práci, pri rôznych evolučných dejinách populácií a pri odlišnej kvalite dát. Zdroj neuvádza konečné riešenie všetkých problémov lokálnej introgresie, ale predstavuje nástroj, ktorý má tieto analýzy spresniť. Jeho dostupný kód a manuál môžu uľahčiť ďalšie overovanie v komunite.


Zdroj: PubMed Research

Pôvodný článok: https://pubmed.ncbi.nlm.nih.gov/42182113/


Môže sa Vám ešte páčiť...

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *