Ce este un NPU? Explicat

Ce este NPU și cum transformă tehnologia AI pe laptopuri?

În ultimele decenii, tehnologia a evoluat rapid, aducându-ne inovații care au revoluționat modul în care interacționăm cu lumea digitală. După CPU și GPU, următoarea mare noutate pe piață este NPU, sau Unități de Procesare Neurală. Aceste unități au captat atenția nu doar a inginerilor, ci și a utilizatorilor obișnuiți, deoarece facilitatează caracteristici avansate de inteligență artificială (AI). Companiile din întreaga lume îmbrățișează puterea NPU-urilor pentru a oferi experiențe generative AI, iar laptopurile, cum ar fi cele din gama Copilot+, echipate cu procesoare Qualcomm Snapdragon X series, demonstrează acest lucru prin NPU-uri capabile să proceseze până la 45 TOPS (trilioane de operații pe secundă).

În plus, Apple aduce pe piață Neural Engine-ul său, care se descurcă cu până la 38 TOPS, iar Intel și AMD plănuiesc să lanseze NPUs de generație următoare pentru platformele Lunar Lake (48 TOPS) și Strix Point (50 TOPS). Odată cu hype-ul în jurul NPU-urilor, este esențial să ne întrebăm: ce este un NPU și ce rol are acesta?

Ce este un NPU?

NPU este abrevierea pentru Neural Processing Unit, o unitate special concepută pentru a gestiona sarcinile legate de inteligența artificială. Aceste sarcini includ procesarea rețelelor neuronale, activitățile de învățare automată și sarcinile specifice AI. O caracteristică definitorie a NPU-urilor este abilitarea lor de a efectua calcule matematice, cum ar fi înmulțirile de matrici (cunoscute și sub numele de ‘matmul’) într-un mod extrem de rapid.

De asemenea, pentru orice sarcină AI, procesarea paralelă joacă un rol crucial, deoarece rețelele neuronale procesează simultan multiple operații. NPU-urile sunt echipate cu acceleratoare specializate care deblochează paralelismul la scară largă. Alături de o memorie cu lățime de bandă mare, NPU-urile pot efectua rapid operații paralele de matmul pe mai multe nuclee. Pe scurt, NPU-urile sunt concepute pentru sarcini AI, unde accentul se pune pe deblocarea paralelismului, executarea rapidă a operațiunilor de matmul și facilitarea scalabilității. Este important de reținut că diferite companii folosesc denumiri diferite pentru NPU-uri: Google le numește TPU (Tensor Processing Unit), iar Apple le denumește Neural Engine.

Care este diferența dintre NPU, CPU și GPU?

NPUs se concentrează pe sarcini legate de AI, ceea ce le face unități de procesare specifice aplicațiilor. În contrast, CPU-ul este o unitate de procesare de utilizare generală, capabilă să gestioneze o varietate largă de sarcini. De exemplu, CPU-urile pot gestiona operațiunile sistemului de operare și aplicațiile generale. În timp ce CPU-urile sunt excelente pentru sarcinile pe un singur fir, sunt mai puțin eficiente în gestionarea sarcinilor paralele.

GPU-urile, pe de altă parte, sunt concepute în mod special pentru redarea graficii, fiind foarte eficiente în rularea jocurilor și crearea de simulări. Deși GPU-urile pot efectua sarcini în paralel, cum fac și NPU-urile, NPU-urile au fost optimizate exclusiv pentru operațiuni legate de AI, ceea ce le conferă un avantaj în ceea ce privește viteză și eficiență.

În trecut, când nu existau GPU-uri sau NPU-uri, CPU-ul gestiona întreaga grafică folosind redarea software. Odată cu avansările tehnologice din anii 1990, GPU-urile au preluat sarcina de redare a graficilor prin hardware dedicat și acum ne aflăm în era NPU-urilor.

Care sunt aplicațiile NPU-ului în laptopuri?

NPUs sau acceleratoarele hardware specializate pentru AI au fost folosite inițial de companii mari pentru procesarea paralelă. Totuși, produsele destinate consumatorilor, precum laptopurile și smartphone-urile, beneficiază acum de NPU-uri. De exemplu, laptopurile Copilot+ de la Microsoft sunt echipate cu un NPU puternic care va alimenta funcții precum Recall — o caracteristică ce va fi disponibilă în curând.

Funcția Recall capturează capturi de ecran, procesează datele pe dispozitiv folosind NPU-ul și creează un index vectorial. Dacă CPU-ul sau GPU-ul ar fi procesat aceste date, ar fi dus la descărcarea rapidă a bateriei. Grație NPU-ului dedicat, acum se pot desfășura operațiuni AI fără a compromite durata de viață a bateriei sau a solicita CPU-ul sau GPU-ul.

În mod similar, NPU-urile sunt responsabile de funcționalități precum Cocreator în MS Paint, generarea de imagini în aplicația Photos, eliminarea fundalului din clipurile video, aplicarea efectelor vizuale folosind Magic Mask pe DaVinci Resolve, upscalarea cadrelor în jocuri, aplicarea efectelor Windows Studio, generarea de traduceri și transcrieri în timp real și multe altele.

Este evident că aplicațiile NPU-urilor se vor extinde pe termen lung, eliberând CPU-ul și GPU-ul de sarcini adiționale, ceea ce va face dispozitivele mai rapide și eficiente din punct de vedere al bateriei.

Apple, pe de altă parte, folosește Neural Engine-ul său pentru a alimenta multe funcții de inteligență artificială pe iOS, iPadOS și macOS. Acest model de AI on-device folosește Neural Engine pentru a rezuma email-uri, a prioritiza notificări, a genera sinteze ale înregistrărilor de apeluri, a crea imagini și multe altele. Noua Siri, de asemenea, beneficiază de pe urma Neural Engine-ului pentru a gestiona numeroase sarcini AI.

Concluzie

Pe scurt, NPU este un accelerator hardware inovativ care poate deschide noi posibilități în era AI. Această tehnologie abia începe să fie explorată, iar noi aplicații și experiențe bazate pe NPU vor apărea în curând. Cu un viitor promițător, NPU-urile vor transforma modul în care interacționăm cu tehnologia în moduri la care nu ne-am gândit niciodată.