Pangenomul uman de referinţă: prima „hartă” a genomului uman care reflectă diversitatea populației

  • Medicina personalizată



Construirea primului draft pentru referința de tip pangenom uman a fost raportată în Nature, cuprinzând un set de date genomice care au la bază secvențierea ADN-ului a 47 de persoane reprezentând populații diferite. Spre deosebire de utilizarea unui genom de referință alcătuit din secvențe de ADN provenite de la o singură persoană, pangenomul uman va permite o înțelegere mai complexă și echitabilă a diversității genomice.

Noul genom de referință are o acuratețe mai ridicată și crește semnificativ capacitatea de detectare a variantelor la nivelul genomului uman, cu 104% a celor structurale și cu 34% a celor de dimensiuni mici.

abonare

Tehnicile avansate computaționale au permis construcția unui pangenom care acoperă peste 99% din secvențe, cu o acuratețe de peste 99%. În plus față de secvența genomului actual de referință, au fost adăugate aproape 120 de milioane de noi baze. Această realizare aparţine The Human Pangenome Reference Consortium (HPRC), care şi-a propus să includă în noua referinţă, secvenţele genomice de la 350 de persoane, până la jumătatea anului 2024. Deoarece materialul genetic al fiecărei persoane este diploid, pangenomul include de fapt 94 de secvenţe diferite, iar la final va conţine 700.

Publicarea pangenomului uman de referinţă - un pas înainte către o abordare echitabilă în genomica umană
Sursa foto: Unsplash

Genomul diferă între persoane printr-un număr scăzut de nucleotide, sub 1%, dar acest procent este cel care determină unicitatea fiecărei fiinţe umane. Totodată, diferenţele între secvenţele de nucleotide oferă informaţii despre sănătatea unei persoane, pe baza acestora putând fi diagnosticate boli, pot fi identificaţi factori de risc, poate fi estimată evoluţia unei afecţiuni şi pot fi indicate terapii eficace personalizate pentru fiecare persoană în parte.

Estimarea tuturor acestor caracteristici se realizează cu precizie scăzută atunci când genotipul unei persoane este foarte diferit de genomul de referință. Genomul de referință uman reprezintă secvența standard utilizată pentru a alinia, asambla și analiza alte secvențe genomice umane. Astfel sunt evidențiate diferențele de la nivelul genotipului unei persoane, raportate la această referință.

Actuala secvență utilizată drept referință pentru genomul uman a fost obținută în urmă cu aproximativ 20 de ani, însă a fost completată constant, în urma avansului tehnologiilor de genomică și bioinformatică. Această referință reflectă în mod limitat diversitatea genotipurilor umane, la baza sa fiind analiza ADN-ului a 20 de persoane, însă majoritatea secvențelor incluse aparțin doar unei persoane. Din această cauză, genomul de referință utilizat în prezent nu este reprezentativ și incluziv pentru orice persoană, indiferent de originea sa ancestrală.

Acest genom uman de referință are secvențe lipsă, în special la nivelul regiunilor repetitive. Noile tehnologii care pot să realizeze citiri pentru secvențe lungi de ADN au contribuit la identificarea acestor regiuni lipsă, astfel că a fost generată prima secvență completă a genomului uman, în cadrul consorțiului Telomere-to-Telomere. Această secvență este cuprinsă în noua referință de tip pangenomic.

Referințele anterioare au fost unice și liniare, însă pangenomul cuprinde simultan mai multe versiuni diferite ale secvențelor genomice umane. Variantele structurale, care pot cuprinde mii de baze azotate, pot fi identificate cu acuratețe ridicată prin utilizarea pangenomului de referință. Astfel, vor fi identificate modificări genetice care nu pot fi depistate prin metodele dependente de secvențe liniare de referință.

Până în prezent, majoritatea variantelor structurale care există la nivelul unui genotip uman au putut fi depistate prin utilizarea metodelor de secvențiere de tip short-read, din cauza erorilor generate de utilizarea unei singure secvențe de referință. Cu ajutorul noului pangenom, pot fi depistate zeci de mii de variante genomice în regiuni care au fost anterior inaccesibile. Astfel, pot fi descifrate mecanismele care asociază particularitățile genetice de caracteristicile bolilor.

Pentru eforturile de a obține secvențele care alcătuiesc pangenomul de referință s-au investit aproximativ 40 de milioane de dolari pentru o perioadă de 5 ani. Sursa unora dintre genomurile incluse în pagenomul de referință este reprezentată de proiectul 1000 Genomes. HPRC va continua să includă din ce în ce mai multe secvențe în noua referință pentru a crește calitatea și diversitatea acesteia.

Citește și: