STUDIU. Măsurarea activității fizice prin dispozitive de tip wearable, mai precisă cu o nouă tehnologie AI

  • Medicina digitală



Un studiu publicat în jurnalul NPJ Digital Medicine prezintă o soluție prin care Big Data și inteligența artificială pot fi utilizate pentru îmbunătățirea performanțelor tehnologiei wearable. Folosindu-se peste 700.000 de date de accelerometrie din UK Biobank, a fost dezvoltat un model AI pre-antrenat care poate interveni în creșterea acurateței dispozitivelor de identificare și monitorizare a activității fizice.

Instrumentul este baza pentru viitoare aplicații digitale inteligente care să îmbunătățească performanțele dispozitivelor wearable de monitorizare a activității fizice. Deși sunt din ce în ce mai comune pe încheieturile noastre, în ultimii ani nu s-au înregistrat avansuri notabile în zona tehnologiei wearable. Odată cu evoluția acestei tehnologii, caracteristici precum sensibilitatea și acuratețea cu care sunt înregistrați parametri medicali ai utilizatorului vor crește, conducând la un management mai bun al sănătății, activității sportive și stării de bine în general.

abonare

Modelul pre-antrenat poate fi implicat în aplicații din domenii care utilizează seturi de date neetichetate sau în cele în care eșantionarea datelor este dificilă. De asemenea, instrumentul digital ar putea fi de un real ajutor în timpul studiilor clinice, unde în general se lucrează cu o cantitate mare de date neetichetate, iar accesul la seturile de date etichetate este dificil.

În general în majoritatea cercetărilor, algoritmii sunt antrenați pe seturi de date obținute în anumite condiții de mediu stricte (de exemplu: în timpul efectuării anumitor antrenamente fizice intense, moderate, în repaus, în timpul somnului etc). În cazul studiului publicat în NPJ Digital Medicine, algoritmul a fost antrenat pe seturi de date ample care nu corespund doar unor activități specifice, ci acoperă toate mișcările efectuate de un utilizator într-o zi, în mediul lor obișnuit.

STUDIU. Big Data și inteligența artificială pot îmbunătăți tehnologia wearable
Sursă imagine: freepik.com

Inițial, pentru a fi antrenat, modelul AI a fost aplicat pe setul de peste 700.000 de date de accelerometrie din UK Biobank. Aceste date au fost colectate în urma unui studiu desfășurat de UK Biobank de la mai mult de 100.000 de participanți care au purtat un dispozitiv cu accelerometru pe încheietură timp de 7 zile, perioadă în care își desfășurau activitățile obișnuite. În acest mod, informațiile acumulate acopereau o gamă foarte vastă de mișcări și activități pe care o persoană le întreprinde în mod normal în viața de zi cu zi.

Ulterior, pentru a-i fi evaluate performanțele, modelul a fost aplicat pe 8 seturi de date de referință. Rezultatele au fost pozitive, instrumentul depășit performanțele de bază cu 24,4%, în medie. Alte avantaje ale modelului studiat sunt adaptabilitatea și posibilitatea de generalizare de-a lungul unei plaje largi de senzori de mișcare, medii de trai, grupuri de utilizatori și seturi de date externe.

Tehnologia din spatele modelului AI pre-antrenat

Modelul AI este de fapt o rețea neuronală multi-tasking cu auto-reglare (multi-task self-supervised learning). Auto-reglarea (self-supervised) este un proces de învățare automată prin care rețele neuronale se antrenează singure, fără a necesita date etichetate sau seturi de date speciale pentru training. Această abordare a fost utilizată cu succes și în alte contexte precum construcția GPT-urilor și a LLM-urilor.

Datele neetichetate (unlabeled data) sunt acele date cărora nu le-au fost atribuite identificatori (etichete – tags/labels) care să facă referire la caracteristicile, proprietățile sau alte informații specifice lor. Sunt utilizate în construcția modelelor de învățare automată nesupervizate (cum este cazul modelului descris anterior), unde algoritmul parcurge seturile de date pentru a identifica tipare, a face corelații și clasificări, fără să i se fi programat înainte ce informații să caute.

Diferența dintre datele etichetate și cele neetichetate
Diferența dintre datele etichetate și cele neetichetate. Sursă imagine: livebook.manning.com.

Deși este mai avantajos să se folosească date etichetate în învățarea automată, de multe ori acestea sunt indisponibile sau au un cost prea ridicat. Pe de altă parte, seturile de date neetichetate sunt foarte accesibile, atât din punct de vedere al costului cât și al abundenței în care se găsesc. De asemenea, folosindu-se astfel de date, pot fi identificate anumite tipare ascunse sau trecute cu vederea și făcute diverse corelații care nu au putut fi detectate utilizându-se date etichetate.

Citește și: