Asistenții digitali, cum ar fi Alexa, Google Assistant și Siri, au evoluat considerabil în ultimii ani. Cu toate acestea, în ciuda progreselor lor, un aspect le limitează încă: dificultatea de a înțelege intenția utilizatorilor. Ei depind excesiv de comenzi vocale prestabilite.
Recunoașterea vocală: o iluzie ingenioasă
Asistenții vocali nu posedă o înțelegere autentică a limbajului uman. Când interacționați cu un Google Home sau un Amazon Echo, dispozitivul convertește cuvintele dumneavoastră într-un șir de text, pe care apoi îl compară cu o listă de comenzi. Dacă se găsește o potrivire exactă, asistentul vocal execută instrucțiunile asociate. În caz contrar, încearcă o alternativă bazată pe informațiile disponibile, iar dacă niciuna nu funcționează, veți primi un mesaj de tipul „Îmi pare rău, nu știu cum să fac asta”. Așadar, în esență, este o tehnică ingenioasă care creează iluzia înțelegerii.
Acești asistenți nu pot utiliza indicii contextuale pentru a face cea mai bună presupunere, nici nu pot aplica cunoștințe similare pentru a lua decizii. Este ușor să-i „păcălești”. De exemplu, dacă întrebați Alexa: „Lucrezi pentru NSA?”, ea va oferi un răspuns. Totuși, dacă întrebați: „Ești în secret parte din NSA?”, este posibil să primiți un răspuns de genul: „Nu știu ce este asta” (cel puțin în momentul redactării acestui articol).
Oamenii, care înțeleg cu adevărat vorbirea, nu funcționează în acest mod. Imaginați-vă că întrebați o persoană: „Ce este acel klarvain de pe cer? Cel arcuit și plin de culori, precum roșu, portocaliu, galben și albastru?” Chiar dacă „klarvain” este un cuvânt inventat, persoana respectivă ar înțelege din context că descrieți un curcubeu.
Un om nu doar transformă vorbirea în idei, dar aplică cunoștințele și înțelegerea pentru a formula un răspuns. Dacă întrebați o persoană dacă lucrează în secret pentru NSA, aceasta va răspunde cu „da” sau „nu”, chiar dacă răspunsul este fals. Un om nu ar spune niciodată „Nu știu ce este asta” la o astfel de întrebare. Abilitatea de a minți vine ca o consecință a înțelegerii reale.
Asistenții vocali: limitați de programare
Asistenții vocali sunt limitați de parametrii programați. Orice abatere de la aceștia poate duce la întreruperea procesului. Acest aspect devine evident în cazul dispozitivelor terțe. De obicei, comanda pentru a interacționa cu acestea este complicată, de tipul „Spune producătorului dispozitivului să comande un argument opțional”. Un exemplu concret ar fi: „Spune-i lui Whirlpool să oprească uscătorul”. Un alt exemplu, mai dificil de memorat, este abilitatea Geneva Alexa, care controlează anumite cuptoare GE. Utilizatorul trebuie să-și amintească să spună „spune-i Genevei”, nu „spune GE”, urmat de restul comenzii. Și, deși puteți cere preîncălzirea cuptorului la 175 de grade Celsius, nu puteți continua cu o cerere de a crește temperatura cu încă 25 de grade Celsius. Un om, totuși, ar putea face acest lucru.
Amazon și Google au investit eforturi considerabile pentru a depăși aceste dificultăți și rezultatele sunt vizibile. Acolo unde odată era necesară o secvență complicată pentru a controla o încuietoare inteligentă, acum se poate spune simplu „încuie ușa din față”. Alexa obișnuia să se încurce când era întrebată „spune-mi o glumă cu un câine”, dar acum înțelege și oferă o glumă. Au fost adăugate variații la comenzi, dar în cele din urmă, tot trebuie să știți comanda exactă pe care să o utilizați. Trebuie să utilizați sintaxa corectă, în ordinea corectă.
Și dacă vi se pare că seamănă cu o linie de comandă, aveți dreptate.
Asistenții vocali: o linie de comandă sofisticată
O linie de comandă este concepută pentru a îndeplini sarcini simple, dar numai dacă știți sintaxa corectă. Dacă faceți o greșeală în sintaxă și introduceți „dyr” în loc de „dir”, veți primi un mesaj de eroare. Puteți utiliza aliasuri pentru a reține mai ușor comenzile, dar trebuie să cunoașteți comenzile originale, cum funcționează și cum să utilizați eficient aliasurile. Dacă nu investiți timp pentru a învăța comenzile din linia de comandă, nu veți obține prea multe rezultate.
Asistenții vocali funcționează similar. Trebuie să știți cum să formulați corect o comandă sau o întrebare. Trebuie să știți cum să configurați grupuri pentru Google și Alexa, de ce gruparea dispozitivelor este esențială și cum să denumiți dispozitivele inteligente. Dacă nu urmați acești pași, veți ajunge să cereți asistentului vocal să oprească un anumit program și să fiți întrebat: „Care program?”
Chiar și atunci când utilizați sintaxa corectă, în ordinea corectă, procesul poate eșua. Fie se oferă un răspuns eronat, fie rezultatul este neașteptat. Două dispozitive Google Home din aceeași casă pot oferi prognoza meteo pentru locații diferite, chiar dacă au acces la aceleași informații despre contul utilizatorului și la aceeași conexiune la internet.
În exemplul de mai sus, se dă comanda „Setează un cronometru pentru jumătate de oră”. Dispozitivul Google Home a creat un cronometru numit „Ora” și a întrebat cât de lung să fie. Totuși, repetarea aceleiași comenzi de trei ori a dus la crearea unui cronometru de 30 de minute. Utilizarea comenzii „Setează un cronometru pentru 30 de minute” are rezultate consecvente.
Chiar dacă interacțiunea cu Google Home sau Echo pare mai fluidă, asistenții vocali și liniile de comandă funcționează similar. Nu este necesar să învățați o limbă nouă, dar trebuie să învățați un dialect nou.
Înțelegerea limitată a asistenților vocali: un impediment pentru dezvoltare
Toate aceste limitări nu împiedică asistenții vocali precum Google Assistant și Alexa să funcționeze destul de bine (deși Cortana are performanțe mai slabe). Google Assistant și Alexa efectuează căutări online decente, iar Google este superior la căutare și poate oferi răspunsuri la întrebări de bază, cum ar fi conversii de unități și calcule simple. Cu o casă inteligentă configurată corect și un utilizator bine antrenat, majoritatea comenzilor pentru casă inteligentă vor funcționa conform așteptărilor. Dar aceste rezultate sunt obținute prin muncă și efort, nu prin înțelegere intelectuală.
Temporizatoarele și alarmele erau inițial instrumente simple. De-a lungul timpului, a fost adăugată capacitatea de a denumi alarmele, apoi de a adăuga timp la cronometre. Asistenții vocali pot răspunde la mai multe întrebări, iar noi abilități și funcții sunt adăugate zilnic. Însă această evoluție nu este un produs al auto-dezvoltării bazate pe învățare și înțelegere.
În plus, nu există capacitatea inerentă de a utiliza informațiile cunoscute pentru a înțelege necunoscutul. Pentru fiecare comandă și întrebare care funcționează, vor exista mereu trei care nu funcționează. În lipsa unei descoperiri majore în inteligența artificială care să ofere o capacitate de înțelegere similară celei umane, asistenții vocali nu sunt cu adevărat „asistenți”. Ei sunt, mai degrabă, linii de comandă vocale: utile în anumite scenarii, dar limitate la acele scenarii pentru care au fost programați.
Cu alte cuvinte, mașinile învață, dar nu pot înțelege.