STUDIU. GPT-4 ar putea ajuta medicii să realizeze examinări fizice generale, pe baza simptomelor pacienților

Medicina digitală

Ruxandra Schitea
02 ianuarie 2025
Citit de 105 ori.

O echipă de cercetători de la Mass General Brigham au testat capacitatea GPT-4 de a ajuta medicii în timpul examinărilor fizice de rutină, oferind recomandări în funcție de nevoile pacienților. Rezultatele obținute au fost publicate în Journal of Medical Artificial Intelligence. GPT-4 a obținut un scor mediu de 49,16 din 60 de puncte, generând recomandări detaliate și extensive. Cu toate acestea, au existat situații în care răspunsurile oferite au fost fie prea vagi, inconsistente sau omiteau cu totul detalii importante, fie conțineau multe informații irelevante.

Performanțele instrumentului au fost evaluate de trei medici, în funcție de următoarele criterii: acuratețea, comprehensibilitatea, lizibilitatea și calitatea generală a recomandărilor. Cel mai bun scor (54 din 60) s-a înregistrat atunci când a oferit recomandări cu privire la simptomul „durere de picior la efort”, pe când cel mai mic scor (43 din 60) a fost obținut când a oferit răspunsuri cu privire la „durere în zona abdomenului inferior”.

În ciuda beneficiilor pe care le-ar putea aduce sprijinind medicii în timpul examinărilor fizice, GPT-4 încă prezintă limitări. Chiar dacă poate oferi recomandări detaliate și ample, uneori răspunsurile sunt lipsite de specificitate și există cazuri în care sunt omise informații importante. Una din îmbunătățirile sugerate în studiu este ca instrumentul să ia în calcul și parametri vitali în momentul în care analizează cazul și oferă sfaturi.

GPT-4 ar putea ajuta medicii în timpul examinărilor fizice generale, însă uneori răspunsurile sunt vagi și inconsistente — Sursă imagine: freepik.com

„Medicii pot întâmpina provocări în realizarea unei examinări fizice corespunzătoare din cauza lipsei de experiență sau a altor factori precum lipsa resurselor din cabinet. Large Language Models precum GPT-4 au potențialul de a ajuta la depășirea acestor provocări, oferind suport medicilor și altor profesioniști medicali cu tehnici de examinare fizică și îmbunătățind astfel abilitățile de diagnostic în cadrul cabinetului medical” – afirmă autorul senior al studiului Dr. Marc D. Succi, strategic innovation leader Mass General Brigham Innovation, director executiv al Medically Engineered Solutions in Healthcare (MESH) Incubator, Mass General Brigham.

Până acum Large Language Models de tipul GPT-4 au fost studiate ca instrumente ce pot sprijinii medicii în punerea diagnosticului, însă nu și ca ustensile ce oferă recomandări cu privire la examinarea fizică generală a unui pacient. Studii anterioare au adresat potențialul GPT-urilor în domeniul medical:

Cercetătorii de la Mass General Brigham i-au solicitat lui GPT-4 să recomande tehnici de examinare fizică pentru 19 cazuri specifice – situații în care pacienții se prezintă la doctor, regăsite în Hypothesis Driven Physical Exam Student Handbook, o carte a American Association of Medical Colleges. Astfel de cazuri implică prezentarea la medic a unui pacient care resimte, de exemplu, durere de șold, murmur cardiac, pierdere a auzului, durere abdominală șamd.

Următorul scenariu a fost introdus în GPT-4: „Te rog oferă-mi tehnici de examinare fizică, detaliate, personalizate și specifice pentru fiecare situație în parte a pacientului”. După ce instrumentul a răspuns acestei solicitări, oamenii de știință au introdus pe rând cele 19 cazuri. Recomandările oferite de GPT-4 au fost evaluate pe baza scalei Likert, un pontaj de la 1 la 5, unde 1 echivalează un scor precar, iar 5 un scor excelent. Dintr-un total de 5, în urma evaluării, LLM-ul a obținut următoarele scoruri: acuratețe – 4,16; comprehensibilitate – 3,95; consistență – 4,39; calitate generală – 3,89.

Citește și: