Cancer Genome Interpreter (CGI): instrumentul virtual, bazat pe AI, care poate ghida etapa de interpretare a datelor obținute în urma secvențierii genomului tumoral




Identificarea mutațiilor „driver” și diferențierea lor de cele „passenger” au reprezentat, de-a lungul timpului, un subiect important de cercetare în domeniul oncologiei de precizie. În funcție de particularitățile tumorale și tipul de cancer, numărul de mutații driver necesare pentru ca o celulă normală să se transforme într-un malignă, variază. Ca exemplu foarte general, de nivel macro (deoarece înțelegerea tumorală actuală aduce noi perspective asupra clasificării cancerelor), pentru apariția cancerului pulmonar este nevoie de șase mutații driver, iar pentru cel de sân, de patru.

Cancer Genome Interpreter (CGI) este un software care combină învățarea automată (Machine Learning, ML) cu principiile bioinformaticii, pentru identificarea mutațiilor genetice „driver” din diverse tipuri de cancer, precum și a biomarkerilor predictivi (pe baza cărora ar putea fi estimată eficacitatea terapeutică). 

abonare

CGI poate fi accesat gratuit din plaforma cancergenomeinterpreter.org și este adresat cercetătorilor și profesioniștilor din domeniul medical. Software-ul reprezintă una dintre livrabilele principale din Proiectul NONCODRIVERS, al Institutului de Cercetare în Biomedicină din Spania, susținut și finanțat de Consiliul European de Cercetare (ERC). 

Instrumentul virtual permite introducerea în secțiunea ANALYSIS a unui set de date de intrare constând din tipul de cancer, alterațiile tumorale, genomul de referință utilizat pentru secvențiere (precum și alte informații specifice obținute în urma secvențierii probei de țesut) și returnează informații relevante clinic pentru managementul și parcursul pacientului.

„Am demonstrat că dacă avem suficiente date, putem să construim modele computerizate informative. Cu cât avem mai multe date, cu atât putem genera mai multe informații. Sunt foarte importante și metadatele, precum vârsta pacientului, statutul de fumător sau dacă mai prezintă și alte mutații la nivel celular” – a declarat coordonatorul proiectului NONCODRIVERS, Prof. Nuria Lopez-Bigas, Institutul de Cercetare în Biomedicină, Spania.

CGI identificare mutatii driver oncologie

Raționamentul și modelul din spatele instrumentului online CGI

Sumarizat, standardul actual al diagnosticării de precizie în oncologie presupune prelevarea unei probe tumorale, secvențierea ADN-ului tumoral utilizând diverse instrumente moderne și interpretarea rezultatelor obținute. Această ultimă etapă este cea mai complexă și consumatoare de timp – mii de mutații sunt identificate la nivel tumoral, însă doar câteva dintre acestea au relevanță clinică și terapeutică. Conform dezvoltatorilor de la Institutul de cercetare din Spania, CGI are potențialul de a ghida faza de interpretare, scurtând astfel timpul necesar pentru fiecare caz în parte. Iar pentru pacienții oncologici, timpul dintre diagnosticare și inițierea tratamentului poate face diferența dintre viață și moarte.

Cancerul este o boală a genomului și apare, în majoritatea cazurilor, ca urmare a mutațiilor somatice. Însă nu toate mutațiile de la nivelul genomului sunt responsabile de carcinogeneză. Mutațiile aleatorii care se acumulează constant, fără a avea un impact negativ asupra supraviețuirii celulei, sunt mutații „passenger”. Acestea nu promovează creșterea tumorală. Mutațiile driver, în schimb, determină transformarea malignă a celulelor – oncogeneza (apariția cancerului). Se consideră că mutațiile driver sunt aceleași pentru fiecare tip de tumoră, în timp ce mutațiile passenger sunt diferite de la pacient la pacient.

„Cele mai multe mutații nu afectează funcția celulară, motiv pentru care le numim mutații pasagere. Pentru a putea eficientiza dezvoltarea terapiilor oncologice, trebuie să îmbunătățim etapa de interpretare. Trebuie să fim capabili să determinăm care mutații sunt mutații responsabile de apariția cancerului. Există deja numeroase date despre tumorile umane. Am vrut să vedem dacă învățarea automată poate fi aplicată pe aceste date pentru a diferenția mai bine între mutațiile pasagere și mutațiile driver”.

Datele utilizate provin din peste 28.000 de tumori secvențiate. Cu ajutorul algoritmilor de învățare automată, antrenați pe seturi de gene tumorale, echipa a generat ulterior un model computerizat capabil să analizeze și să clasifice toate variantele posibile întâlnite la nivelul genelor respective, în mutații driver și pasager. La final, oamenii de știință au reușit să mapeze mutațiile driver pentru 84 de gene.

mod functionare cancer genome interpreter
Modul de funcționare al soluției Cancer Genome Interpreter. Sursă imagine și mai multe detalii.

Conform studiului publicat în Genome Medicine, care analizează relevanța clinică și biologică a modificărilor tumorale identificate cu ajutorul Cancer Genome Interpreter, software-ul aduce beneficii în două arii:

  • Poate identifica într-o tumoră secvențiată toate alterațiile genomice cunoscute drept având potențial oncogen, dar și acele alterații a căror semnificație nu este cunoscută.
  • Poate identifica toate variantele tumorii care constituie biomarkeri și care ar putea prezice răspunsul la un anumit tratament.
  • În final, variantele sunt clasificate în funcție de relevanța clinică.

Având drept input o listă cu modificări genomice prezente într-o tumoră, într-un anumit tip de cancer, CGI identifică posibilele alterații driver în tumora respectivă, utilizând modelele computaționale BoostDM și OncodriveMut. În ceea ce privește mutațiile care constituie biomarkeri pentru răspunsul la un anumit tratament, acestea sunt identificate cu ajutorul unor baze de date precum CIviC, OncoKB și Cancer Biomarkers.

  • BoostDM reprezintă componenta de machine learning a software-ului – cuprinde o matrice de modele de învățare automată, antrenate pentru identificare mutațiilor driver.
  • OncodriveMut reprezintă componenta bioinformatică a sistemului, care clasifică mutațiile observate în genele oncologice în mutații driver sau pasagere.

 

Citește și: