Majoritatea oamenilor se simt confortabil cu recunoașterea facială pentru utilizarea acesteia în filtrele Instagram și Face ID. Dar această tehnologie relativ nouă se poate simți puțin înfiorătoare. Fața ta este ca o amprentă, iar tehnologia din spatele recunoașterii faciale este complexă.
Ca în orice tehnologie nouă, recunoașterea facială are dezavantaje. Aceste dezavantaje devin din ce în ce mai evidente pe măsură ce armata, poliția, agenţi de publicitate, și creatorii de deepfake, găsesc noi modalități de a profita de software-ul de recunoaștere facială.
Acum, mai mult ca niciodată, este esențial ca oamenii să înțeleagă cum funcționează recunoașterea facială. De asemenea, este important să cunoaștem limitările recunoașterii faciale și cum se va dezvolta aceasta în viitor.
Cuprins
Recunoașterea facială este surprinzător de simplă
Înainte de a intra în numeroasele medii diferite pentru recunoașterea facială, este important să înțelegeți cum funcționează procesul de recunoaștere facială. Iată trei aplicații pentru software-ul de recunoaștere facială și o explicație simplă a modului în care acestea recunosc sau identifică fețele:
Recunoaștere facială de bază: pentru filtrele Animoji și Instagram, camera telefonului tău „caută” trăsăturile definitorii ale unei fețe, în special o pereche de ochi, un nas și o gură. Apoi, folosește algoritmi pentru a se bloca pe o față și a determina în ce direcție se uită, dacă gura este deschisă etc. Merită menționat că aceasta nu este identificarea facială, este doar un software care caută fețe.
Face ID și programe similare: după configurarea Face ID (sau programe similare) pe telefon, acesta face o fotografie a feței și măsoară distanța dintre trăsăturile feței. Apoi, de fiecare dată când mergeți să vă deblocați telefonul, acesta „se uită” prin cameră pentru a vă măsura și a confirma identitatea.
Identificarea unui străin: atunci când o organizație dorește să identifice o față în scopuri de securitate, publicitate sau poliție, folosește algoritmi pentru a compara acea față cu o bază de date extinsă de fețe. Acest proces este aproape identic cu Face ID de la Apple, dar la scară mai mare. Teoretic, ar putea fi folosită orice bază de date (cărți de identitate, profiluri Facebook), dar o bază de date cu fotografii clare, preidentificate este ideală.
Bine, hai să intrăm la esențialitate. Deoarece „recunoașterea facială de bază” utilizată pentru filtrele Instagram este un proces atât de simplu și inofensiv, ne vom concentra în întregime pe identificarea facială și pe numeroasele tehnologii diferite care pot fi folosite pentru a identifica o față.
Majoritatea recunoașterii faciale se bazează pe imagini 2D
După cum v-ați aștepta, majoritatea software-ului de recunoaștere facială se bazează în întregime pe imagini 2D. Dar acest lucru nu se face pentru că imagistica facială 2D este super precisă, este făcută de dragul confortului. Majoritatea covârșitoare a camerelor fac fotografii fără nicio profunzime, iar fotografiile publice care pot fi folosite pentru bazele de date de recunoaștere facială (fotografii de profil Facebook, de exemplu) sunt toate în 2D.
De ce nu este foarte precisă imaginile faciale 2D? Ei bine, pentru că o imagine plată a feței tale nu are caracteristici de identificare, cum ar fi profunzimea. Cu o imagine plată, un computer vă poate măsura distanța pupilară și lățimea gurii, printre alte variabile. Dar nu poate spune lungimea nasului sau proeminența frunții.
În plus, imagistica facială 2D se bazează pe spectrul luminii vizibile. Aceasta înseamnă că imagistica facială 2D nu funcționează în întuneric și poate fi nesigură în condiții de lumină funky sau întunecată.
În mod clar, soluția pentru unele dintre aceste deficiențe este utilizarea imaginilor faciale 3D. Dar cum este posibil asta? Ai nevoie de echipament special pentru a vedea o față în 3D?
Camerele IR adaugă profunzime identității tale
În timp ce unele aplicații de recunoaștere facială se bazează exclusiv pe imagini 2D, nu este neobișnuit ca recunoașterea facială să se bazeze și pe imagini 3D. De fapt, experiența ta cu recunoașterea facială implică probabil un pic de 3D.
Acest lucru se realizează printr-o tehnică numită lidar, care este similară cu sonarul. În esență, dispozitivele de scanare a feței, cum ar fi iPhone-ul tău, explodează o matrice IR inofensivă în fața ta. Această matrice (un perete de lasere) se reflectă apoi pe fața ta și este preluată de o cameră IR (sau cameră ToF) de pe telefon.
Unde are loc magia 3D? Camera IR a telefonului dvs. măsoară cât de mult durează pentru ca fiecare bit de lumină IR să iasă de pe față și să revină la telefon. Desigur, lumina care se reflectă de pe nasul tău va avea o călătorie mai scurtă decât lumina care se reflectă de pe urechi, iar camera IR folosește aceste informații pentru a crea o hartă unică de adâncime a feței tale. Când este utilizată împreună cu imaginile 2D de bază, imaginile 3D pot crește semnificativ acuratețea software-ului de recunoaștere facială.
Imaginile Lidar sunt un concept ciudat care poate fi dificil de înțeles. Dacă vă ajută, încercați să vă imaginați că plasa IR de pe telefon (sau orice dispozitiv de recunoaștere facială) este un jucărie cu panou. Ca o jucărie cu panou, fața ta lasă o adâncime în rețeaua IR, unde nasul tău este vizibil mai adânc decât, să zicem, ochii tăi.
Imagistica termică permite recunoașterea facială să funcționeze noaptea
Unul dintre dezavantajele recunoașterii faciale 2D este că se bazează pe spectrul vizibil al luminii. În termeni profani, recunoașterea facială de bază nu funcționează în întuneric. Dar acest lucru poate fi rezolvat folosind o cameră de imagine termică (da, ca în Tom Clancy).
„Stai puțin”, ai putea spune, „nu se bazează termomagazinul pe lumina IR?” Da, da. Dar camerele termice nu emit explozii de lumină IR; pur și simplu detectează lumina IR care o emite de la obiecte. Obiectele calde emit o tonă de lumină IR, în timp ce obiectele reci emit o cantitate neglijabilă de lumină IR. Camerele costisitoare de termoviziune pot detecta chiar și diferențe subtile de temperatură pe o suprafață, astfel încât tehnologia este ideală pentru recunoașterea facială.
O imagine cu spectru de lumină vizibilă, o imagine termică și o imagine termică compozită.
Există o o mână de moduri diferite pentru a identifica o față cu termoviziune. Toate aceste tehnici sunt incredibil de complicate, dar au unele asemănări fundamentale, așa că vom încerca să păstrăm lucrurile simple cu o listă:
Sunt necesare mai multe fotografii: o cameră de imagine termică realizează mai multe fotografii ale feței unui subiect. Fiecare fotografie se concentrează pe un spectru diferit de lumină IR (unde lungi, scurte și medii). De obicei, spectrul undelor lungi oferă cele mai multe detalii faciale.
Hărțile vaselor de sânge sunt utile: Aceste imagini IR pot fi folosite și pentru a extrage formarea vaselor de sânge pe fața unei persoane. Este înfiorător, dar hărțile vaselor de sânge pot fi folosite ca amprente faciale unice. Ele pot fi, de asemenea, folosite pentru a găsi distanța dintre organele faciale (în cazul în care imagistica termică obișnuită oferă imagini nepotrivite) sau pentru a identifica vânătăi și cicatrici.
Subiectul poate fi identificat: o imagine compusă (sau un set de date) este creată folosind mai multe imagini IR. Această imagine compozită poate fi apoi comparată cu o bază de date facială pentru a identifica subiectul.
Desigur, recunoașterea facială termică este folosită de obicei de armată, nu este ceva ce veți găsi la Khols și nu este ceva care va veni cu următorul telefon mobil. În plus, imaginile termice nu funcționează bine în timpul zilei (sau în medii în general bine iluminate), așa că nu are multe aplicații potențiale în afara armatei.
Limitele recunoașterii faciale
Am petrecut mult timp vorbind despre deficiențele recunoașterii faciale. După cum am văzut din imagistica IR și termică, este posibil să depășim unele dintre aceste limitări. Dar există încă câteva probleme care nu au fost încă rezolvate:
Obstrucție: așa cum v-ați aștepta, ochelarii de soare și alte accesorii pot declanșa software-ul de recunoaștere facială.
Poze: recunoașterea facială funcționează cel mai bine cu o imagine neutră, orientată în față. O înclinare sau întoarcere a capului poate face dificilă recunoașterea facială, chiar și pentru software-ul de recunoaștere bazat pe IR. În plus, un zâmbet, obrajii umflați sau orice altă ipostază pot schimba modul în care un computer îți măsoară fața.
Lumină: Toate formele de recunoaștere facială se bazează pe lumină, fie că este vorba de spectru vizibil sau de lumină IR. Ca rezultat, condițiile de iluminare ciudate pot scădea acuratețea identificării faciale. Acest lucru se poate schimba, deoarece oamenii de știință se dezvoltă în prezent tehnologie de recunoaștere facială bazată pe sonar.
Baza de date: Fără o bază de date bună, recunoașterea facială nu poate funcționa. Pe aceleași linii, este imposibil să identifici o față care nu a fost identificată corect în trecut.
Procesarea datelor: În funcție de dimensiunea și formatul unei baze de date, computerele pot dura ceva timp să identifice corect fețele. În unele situații, cum ar fi poliția, limitările în prelucrarea datelor restricționează utilizarea identificării faciale pentru aplicațiile de zi cu zi (ceea ce este probabil un lucru bun).
În prezent, cea mai bună modalitate de a evita aceste limitări este utilizarea altor forme de identificare împreună cu recunoașterea facială. Telefonul vă va cere o parolă sau o amprentă dacă nu reușește să vă identifice fața, iar Guvernul chinez folosește cărți de identitate și tehnologie de urmărire pentru a închide marja de eroare care există în rețeaua sa de recunoaștere facială.
În viitor, oamenii de știință vor găsi cu siguranță o modalitate de a ocoli aceste probleme. Ei pot folosi tehnologia sonarului alături de lidar pentru a crea hărți faciale 3D în orice mediu și pot găsi modalități de a procesa datele feței (și de a identifica străinii) într-un interval de timp incredibil de scurt. Oricum ar fi, această tehnologie are un mare potențial de abuz, așa că merită să ținem pasul.
Surse: Universitatea din Rijeka, Fundația Electronic Frontier