Cum funcționează recunoașterea facială?

Majoritatea persoanelor se simt confortabile cu tehnologia de recunoaștere facială atunci când aceasta este utilizată în filtrele de pe Instagram sau pentru deblocarea telefonului cu Face ID. Totuși, această tehnologie relativ nouă poate părea puțin înspăimântătoare. Fața ta devine un fel de amprentă digitală, iar mecanismele din spatele recunoașterii faciale sunt complexe.

Ca orice tehnologie inovatoare, recunoașterea facială are și aspecte negative. Aceste neajunsuri devin tot mai evidente pe măsură ce armata, forțele de poliție, agenții de publicitate și creatorii de deepfake găsesc metode noi de a utiliza în avantajul lor software-ul de recunoaștere facială.

Astăzi, mai mult ca oricând, este crucial ca oamenii să înțeleagă cum funcționează recunoașterea facială. De asemenea, este important să fim conștienți de limitele acestei tehnologii și de modul în care se va dezvolta în viitor.

Recunoașterea facială: un proces mai simplu decât pare

Înainte de a explora diversele aplicații ale recunoașterii faciale, este esențial să înțelegem cum funcționează procesul în sine. Iată trei exemple de utilizări ale software-ului de recunoaștere facială, împreună cu o explicație simplă a modului în care acesta recunoaște sau identifică fețele:

Recunoaștere facială de bază: Pentru filtrele Animoji și Instagram, camera telefonului tău „caută” trăsăturile definitorii ale unei fețe, în special ochii, nasul și gura. Apoi, utilizează algoritmi pentru a se bloca pe o față și a determina direcția privirii, dacă gura este deschisă, etc. Este important de menționat că aceasta nu este identificare facială, ci doar un software care detectează fețe.
Face ID și tehnologii similare: După configurarea Face ID (sau a unei tehnologii similare) pe telefon, acesta face o fotografie a feței tale și măsoară distanțele dintre trăsăturile faciale. Apoi, de fiecare dată când încerci să deblochezi telefonul, acesta „se uită” prin cameră pentru a te măsura și a-ți confirma identitatea.
Identificarea unei persoane necunoscute: Atunci când o organizație dorește să identifice o față în scopuri de securitate, publicitate sau aplicare a legii, aceasta folosește algoritmi pentru a compara fața respectivă cu o bază de date extinsă de fețe. Acest proces este similar cu Face ID de la Apple, dar la o scară mai mare. Teoretic, se poate folosi orice bază de date (cărți de identitate, profiluri de Facebook), dar o bază de date cu fotografii clare, pre-identificate este ideală.

În regulă, să trecem la lucrurile esențiale. Deoarece „recunoașterea facială de bază” utilizată pentru filtrele Instagram este un proces simplu și inofensiv, ne vom concentra în principal pe identificarea facială și pe diferitele tehnologii care pot fi folosite pentru a identifica o față.

Majoritatea sistemelor de recunoaștere facială utilizează imagini 2D

După cum te-ai aștepta, majoritatea programelor de recunoaștere facială se bazează în întregime pe imagini 2D. Acest lucru nu se întâmplă pentru că imagistica facială 2D este extrem de precisă, ci din rațiuni practice. Majoritatea camerelor fac fotografii fără informații despre profunzime, iar fotografiile publice care pot fi folosite pentru bazele de date de recunoaștere facială (cum ar fi fotografiile de profil de pe Facebook) sunt în format 2D.

De ce nu este foarte precisă imagistica facială 2D? Deoarece o imagine plată a feței nu include caracteristici de identificare, cum ar fi profunzimea. Cu o imagine plată, un computer poate măsura distanța dintre pupile sau lățimea gurii, printre altele. Însă nu poate determina lungimea nasului sau proeminența frunții.

În plus, imagistica facială 2D se bazează pe spectrul vizibil al luminii. Aceasta înseamnă că nu funcționează în întuneric și poate fi nesigură în condiții de lumină slabă sau neobișnuită.

În mod evident, soluția pentru unele dintre aceste limitări este utilizarea imaginii faciale 3D. Dar cum este posibil acest lucru? Ai nevoie de echipamente speciale pentru a vedea o față în 3D?

Camerele IR adaugă dimensiunea profunzimii identității tale

Deși unele aplicații de recunoaștere facială se bazează exclusiv pe imagini 2D, nu este neobișnuit ca recunoașterea facială să utilizeze și imagini 3D. De fapt, experiența ta cu recunoașterea facială include probabil și o componentă 3D.

Acest lucru se realizează printr-o tehnică numită lidar, similară cu sonarul. În esență, dispozitivele de scanare facială, cum ar fi iPhone-ul tău, emit o matrice IR inofensivă asupra feței tale. Această matrice (un „perete” de lasere) se reflectă apoi pe fața ta și este captată de o cameră IR (sau o cameră ToF) de pe telefon.

Unde are loc „magia” 3D? Camera IR a telefonului tău măsoară cât timp durează ca fiecare rază de lumină IR să se reflecte de pe fața ta și să ajungă înapoi la telefon. Evident, lumina reflectată de nasul tău va avea o „călătorie” mai scurtă decât lumina reflectată de urechi, iar camera IR utilizează aceste informații pentru a crea o hartă unică a adâncimii feței tale. Atunci când este folosită împreună cu imaginile 2D de bază, imagistica 3D poate crește semnificativ acuratețea software-ului de recunoaștere facială.

Imaginile lidar sunt un concept neobișnuit care poate fi dificil de înțeles. Pentru a-ți ușura înțelegerea, imaginează-ți plasa IR de pe telefon (sau de pe orice dispozitiv de recunoaștere facială) ca pe o jucărie cu ace. Ca și în cazul jucăriei cu ace, fața ta lasă o adâncitură în rețeaua IR, unde nasul tău este vizibil mai adânc decât, de exemplu, ochii tăi.

Imagistica termică permite recunoașterii faciale să funcționeze pe timp de noapte

Unul dintre dezavantajele recunoașterii faciale 2D este că se bazează pe spectrul vizibil al luminii. Mai simplu spus, recunoașterea facială de bază nu funcționează în întuneric. Însă această problemă poate fi rezolvată folosind o cameră de termoviziune (asemănătoare cu cele din filmele Tom Clancy).

„Stai puțin”, ai putea spune, „nu se bazează și termoviziunea pe lumină IR?”. Da, este adevărat. Însă camerele termice nu emit raze de lumină IR; ele doar detectează lumina IR emisă de obiecte. Obiectele calde emit o cantitate mare de lumină IR, în timp ce obiectele reci emit o cantitate neglijabilă. Camerele termice performante pot detecta chiar și diferențe subtile de temperatură pe o suprafață, făcând această tehnologie ideală pentru recunoașterea facială.

O imagine în spectrul vizibil al luminii, o imagine termică și o imagine termică compozită.

Există mai multe metode de a identifica o față cu ajutorul termoviziunii. Toate aceste tehnici sunt foarte complexe, dar au câteva similarități fundamentale, așa că vom încerca să simplificăm lucrurile printr-o listă:

Sunt necesare mai multe fotografii: o cameră de termoviziune realizează mai multe fotografii ale feței unui subiect. Fiecare fotografie se concentrează pe un anumit spectru al luminii IR (lungă, scurtă și medie). De obicei, spectrul undelor lungi oferă cele mai multe detalii faciale.
Hărțile vaselor de sânge sunt utile: Aceste imagini IR pot fi folosite și pentru a extrage modelul vaselor de sânge de pe fața unei persoane. Poate părea înfricoșător, dar hărțile vaselor de sânge pot fi folosite ca o amprentă facială unică. Ele pot fi, de asemenea, folosite pentru a calcula distanța dintre trăsăturile faciale (în cazurile în care imaginile termice obișnuite nu oferă informații potrivite) sau pentru a identifica vânătăi și cicatrici.
Subiectul poate fi identificat: Se creează o imagine compozită (sau un set de date) utilizând mai multe imagini IR. Această imagine compozită poate fi apoi comparată cu o bază de date facială pentru a identifica subiectul.

Desigur, recunoașterea facială termică este folosită, în general, de către armată; nu este o tehnologie pe care o vei găsi la un magazin obișnuit și nu va fi inclusă în următorul tău telefon mobil. În plus, imaginile termice nu funcționează bine în timpul zilei (sau în medii bine iluminate), deci nu are multe aplicații potențiale în afara sferei militare.

Limitele recunoașterii faciale

Am dedicat mult timp discuției despre neajunsurile recunoașterii faciale. Așa cum am văzut din imaginile IR și termice, este posibil să depășim unele dintre aceste limitări. Însă există încă câteva probleme care nu au fost rezolvate:

Obstrucții: După cum te-ai aștepta, ochelarii de soare și alte accesorii pot face ca software-ul de recunoaștere facială să eșueze.
Poziții: Recunoașterea facială funcționează cel mai bine cu o imagine neutră, orientată frontal. O înclinare sau o rotire a capului poate îngreuna identificarea facială, chiar și pentru software-ul bazat pe IR. În plus, un zâmbet, obrajii umflați sau orice altă expresie facială pot modifica modul în care un computer măsoară trăsăturile feței.
Lumina: Toate formele de recunoaștere facială se bazează pe lumină, fie că este vorba de spectrul vizibil sau de lumina IR. Ca urmare, condițiile de lumină neobișnuite pot reduce acuratețea identificării faciale. Acest aspect s-ar putea schimba, deoarece oamenii de știință dezvoltă în prezent tehnologii de recunoaștere facială bazate pe sonar.
Baza de date: Fără o bază de date bună, recunoașterea facială nu poate funcționa. În mod similar, este imposibil să identifici o față care nu a fost identificată în mod corect anterior.
Procesarea datelor: În funcție de dimensiunea și formatul unei baze de date, computerele pot avea nevoie de timp pentru a identifica corect fețele. În anumite situații, cum ar fi în activitatea poliției, limitările în prelucrarea datelor restrâng utilizarea identificării faciale în aplicații de zi cu zi (ceea ce este probabil un lucru bun).

În prezent, cea mai bună modalitate de a evita aceste limitări este utilizarea altor forme de identificare împreună cu recunoașterea facială. Telefonul tău îți va cere o parolă sau o amprentă digitală dacă nu reușește să îți identifice fața, iar guvernul chinez folosește cărți de identitate și tehnologii de urmărire pentru a reduce marja de eroare din rețeaua sa de recunoaștere facială.

În viitor, oamenii de știință vor găsi, cu siguranță, modalități de a ocoli aceste probleme. Vor putea folosi tehnologia sonarului împreună cu lidar pentru a crea hărți faciale 3D în orice mediu și vor descoperi modalități de a procesa datele faciale (și de a identifica persoanele necunoscute) într-un timp incredibil de scurt. Oricum ar fi, această tehnologie are un potențial mare de abuz, așa că este important să fim conștienți de ea.

Surse: Universitatea din Rijeka, Fundația Electronic Frontier