08/18/2022

Alexa, Siri și Google nu înțeleg niciun cuvânt pe care îl spui

Asistenții vocali precum Alexa, Google Assistant și Siri au parcurs un drum lung în ultimii ani. Dar, cu toate îmbunătățirile lor, un lucru îi împiedică: nu te înțeleg. Se bazează prea mult pe anumite comenzi vocale.

Recunoașterea vorbirii este doar un truc magic

Asistenții vocali nu te înțeleg. Nu chiar, oricum. Când vorbiți cu un Google Home sau Amazon Echo, acesta vă convertește în esență cuvintele într-un șir de text și apoi le compară cu comenzile așteptate. Dacă găsește o potrivire exactă, atunci urmează un set de instrucțiuni. Dacă nu, caută o alternativă de a face pe baza informațiilor pe care le are și, dacă nu funcționează, veți primi un mesaj de eșec de genul „Îmi pare rău, dar nu știu asta. .” Este puțin mai mult decât o magie a mâinilor să te păcălească să crezi că înțelege.

Nu poate folosi indicii contextuale pentru a face cea mai bună presupunere sau chiar să folosească înțelegerea unor subiecte similare pentru a-și informa deciziile. Nu este greu să declanșezi nici asistenții vocali. În timp ce o poți întreba pe Alexa „Lucrezi pentru NSA?” și obțineți un răspuns, dacă întrebați „Faceți în secret parte din NSA?” primești un răspuns „Nu îl știu pe ăla” (cel puțin la momentul scrierii acestui articol).

Oamenii, care înțeleg cu adevărat vorbirea, nu funcționează așa. Să presupunem că întrebi un om: „Ce este acel klarvain de pe cer? Cel care este arcuit și plin de culori în dungi precum roșu, portocaliu, galben și albastru.” În ciuda faptului că klarvain este un cuvânt inventat, persoana pe care ai întrebat-o probabil ar putea înțelege din context că descrii un curcubeu.

  Cum să creezi un alias pentru adresa ta de e-mail iCloud

În timp ce ați putea susține că un om transformă vorbirea în idei, un om poate aplica apoi cunoștințele și înțelegerea pentru a încheia un răspuns. Dacă întrebi un om dacă lucrează în secret pentru NSA, îți va da un răspuns da sau nu, chiar dacă răspunsul este o minciună. Un om nu ar spune „Nu îl știu pe acela” la o astfel de întrebare. Că oamenii pot minți este ceva care vine cu o înțelegere reală.

Asistenții vocali nu pot depăși programarea lor

Asistenții vocali se limitează în cele din urmă la parametrii așteptați programați, iar rătăcirea în afara acestora va întrerupe procesul. Acest fapt arată când dispozitivele terță parte intră în joc. De obicei, comanda de a interacționa cu aceștia este foarte grea, echivalând cu „spuneți producătorului dispozitivului să comandă un argument opțional”. Un exemplu exact ar fi: „Spune-i lui Whirlpool să întrerupă uscătorul”. Pentru un exemplu și mai greu de reținut, cel Geneva Alexa abilitate controlează unele cuptoare GE. Un utilizator al abilității trebuie să-și amintească să „spună Genevei”, nu „spune GE”, apoi restul comenzii. Și în timp ce îi poți cere să preîncălzi cuptorul la 350 de grade, nu poți continua cu o solicitare de a crește temperatura cu încă 50 de grade. Totuși, un om ar putea urma aceste solicitări.

Amazon și Google au muncit din greu pentru a depăși aceste obstacole și se vede. Acolo unde odată trebuia să urmezi secvența de mai sus pentru a controla o încuietoare inteligentă, acum poți spune „încuie ușa din față”. Alexa obișnuia să fie confuză cu „spune-mi o glumă cu un câine”, dar cere una astăzi și va funcționa. Au adăugat variații la comenzile pe care le utilizați, dar, în cele din urmă, încă trebuie să cunoașteți comanda potrivită pe care să o spuneți. Trebuie să utilizați sintaxa corectă, în ordinea corectă.

  Controlați opacitatea și dimensiunea ferestrelor cu roata mouse-ului

Și dacă crezi că sună mult ca o linie de comandă, nu te înșeli.

Asistenții vocali sunt o linie de comandă elegantă

O linie de comandă este definită în mod restrâns pentru a îndeplini sarcini simple, dar numai dacă cunoașteți sintaxa corectă. Dacă ieși din sintaxa corectă și tastați dyr în loc de dir, atunci promptul de comandă vă va da un mesaj de eroare. Puteți folosi aliasuri pentru comenzi mai ușor de reținut, dar trebuie să vă faceți o idee despre comenzile originale, cum funcționează și cum să utilizați aliasurile în mod eficient. Dacă nu vă faceți timp pentru a învăța elementele din linia de comandă, nu veți obține niciodată prea multe din ea.

Asistentii vocali nu sunt diferiti. Trebuie să știți modul corect de a rosti o comandă sau de a pune o întrebare. Și trebuie să știți cum să configurați grupuri pentru Google și Alexa, de ce gruparea dispozitivelor este esențială și cum să denumiți dispozitivele inteligente. Dacă nu urmați acești pași necesari, veți simți frustrarea de a cere asistentului vocal să oprească studiul doar pentru a fi întrebat „care studiu” ar trebui să fie oprit.

Chiar și atunci când utilizați sintaxa corectă în ordinea corectă, procesul poate eșua. Fie cu răspunsul greșit emis, fie cu un rezultat surprinzător. Două case Google din aceeași casă pot oferi vreme pentru locații ușor diferite, chiar dacă au acces la aceleași informații despre contul de utilizator și la aceeași conexiune la internet.

În exemplul de mai sus, este dată comanda „Setați un cronometru pentru o jumătate de oră”. Centrul Google Home a creat un cronometru numit „Ora” și apoi a întrebat cât de lung ar trebui să fie cronometrul. Și totuși repetarea aceleiași comenzi de alte trei ori a funcționat corect și a creat un cronometru de 30 de minute. Folosirea comenzii „Setați un cronometru pentru 30 de minute” funcționează corect, într-o bază mai consecventă.

  Cum să activați previzualizările filelor în Chrome

În timp ce vorbirea cu Google Home sau Echo poate fi mai fluidă, sub capotă asistenții vocali și liniile de comandă funcționează în același mod. Poate că nu trebuie să înveți o nouă limbă, dar trebuie să înveți un nou dialect.

Înțelegerea îngustă a asistenților vocali va limita creșterea

Nimic din toate acestea nu împiedică asistenții vocali precum Google Assistant și Alexa să funcționeze suficient de bine (deși Cortana este o poveste diferită). Google Assistant și Alexa și caută online întrebări decent, deși nu este surprinzător, Google este mai bun la căutare și poate răspunde la întrebări de bază, cum ar fi conversiile de măsurare și matematica simplă. Cu o casă inteligentă configurată corect și un utilizator bine instruit, majoritatea comenzilor pentru casă inteligentă vor funcționa conform așteptărilor. Dar asta a venit prin muncă și efort, nu prin înțelegere intelectuală.

Temporizatoarele și alarmele erau odinioară simpliste. De-a lungul timpului a fost adăugată denumirea, apoi capacitatea de a adăuga timp la un cronometru. Au trecut de la simplist la mai complicat. Asistenții vocali pot răspunde la mai multe întrebări și fiecare zi aduce noi abilități și funcții. Dar acesta nu este un produs al auto-creșterii care vine din învățare și înțelegere.

Și nimic din toate acestea nu oferă capacitatea inerentă de a folosi ceea ce este cunoscut pentru a ajunge la necunoscut. Pentru fiecare comandă și întrebare care funcționează, întotdeauna vor fi trei care nu funcționează. Fără o descoperire în AI care să ofere o capacitate de înțelegere asemănătoare omului, asistenții vocali nu sunt deloc asistenți. Sunt doar linii de comandă vocală – utile în scenariul potrivit, dar limitate la acele scenarii pentru care au fost programați să le înțeleagă.

Cu alte cuvinte: mașinile învață lucruri, dar nu le pot înțelege.