În ultimele decenii, tehnologia a cunoscut o evoluție rapidă, aducând inovații care au schimbat fundamental modul în care interacționăm cu universul digital. După unitățile centrale de procesare (CPU) și unitățile de procesare grafică (GPU), un nou actor important pe piață este unitatea de procesare neurală (NPU). Aceste componente au atras atenția atât a specialiștilor, cât și a utilizatorilor, datorită capacității lor de a facilita funcții avansate de inteligență artificială (AI). Companii din întreaga lume valorifică potențialul NPU-urilor pentru a oferi experiențe AI generative. Laptopurile, cum ar fi cele din seria Copilot+, echipate cu procesoare Qualcomm Snapdragon X, sunt un exemplu concret, având NPU-uri capabile să proceseze până la 45 TOPS (trilioane de operații pe secundă).
De asemenea, Apple introduce pe piață Neural Engine, capabil de performanțe de până la 38 TOPS, iar Intel și AMD planifică să lanseze NPU-uri de nouă generație pentru platformele Lunar Lake (48 TOPS) și Strix Point (50 TOPS). Odată cu entuziasmul din jurul NPU-urilor, este fundamental să ne întrebăm: ce este un NPU și care este rolul său?
Ce Este un NPU?
NPU, acronim pentru Neural Processing Unit (Unitate de Procesare Neurală), este o componentă special concepută pentru a gestiona sarcinile legate de inteligența artificială. Aceste sarcini includ procesarea rețelelor neuronale, activitățile de învățare automată și sarcinile specifice AI. O caracteristică esențială a NPU-urilor este abilitatea lor de a realiza calcule matematice, cum ar fi înmulțirile de matrici (cunoscute și ca ‘matmul’), într-un mod extrem de rapid.
Procesarea paralelă este vitală pentru orice sarcină AI, deoarece rețelele neuronale gestionează simultan multiple operații. NPU-urile sunt dotate cu acceleratoare specializate care permit un paralelism extins. Împreună cu o memorie cu o lățime de bandă mare, NPU-urile pot efectua rapid operații paralele de matmul pe multiple nuclee. Pe scurt, NPU-urile sunt concepute pentru aplicații AI, punând accent pe paralelism, execuția rapidă a operațiilor de tip matmul și scalabilitate. Trebuie subliniat că diferite companii folosesc denumiri diferite pentru NPU-uri: Google le numește TPU (Tensor Processing Unit), iar Apple le denumește Neural Engine.
Care Este Diferența Dintre NPU, CPU și GPU?
NPU-urile se axează pe sarcinile legate de AI, fiind unități de procesare dedicate anumitor aplicații. Comparativ, CPU-ul este o unitate de procesare generală, capabilă să gestioneze o gamă largă de sarcini. De exemplu, CPU-urile pot gestiona sistemul de operare și aplicațiile obișnuite. Deși CPU-urile sunt performante în sarcinile pe un singur fir, sunt mai puțin eficiente în sarcinile paralele.
GPU-urile, pe de altă parte, sunt specializate pentru redarea grafică, fiind extrem de eficiente în rularea jocurilor și crearea de simulări. Chiar dacă GPU-urile pot realiza sarcini în paralel, similar cu NPU-urile, NPU-urile au fost optimizate special pentru operațiuni legate de AI, ceea ce le conferă un avantaj în ceea ce privește viteza și eficiența.
În trecut, când nu existau GPU-uri sau NPU-uri, CPU-ul se ocupa de întreaga grafică utilizând redarea software. Odată cu progresele tehnologice din anii ’90, GPU-urile au preluat sarcina de redare a graficii prin hardware dedicat, iar acum ne aflăm în era NPU-urilor.
Care Sunt Aplicațiile NPU-ului în Laptopuri?
NPU-urile, sau acceleratoarele hardware specializate pentru AI, au fost utilizate inițial de companiile mari pentru procesarea paralelă. Cu toate acestea, produsele pentru consumatori, precum laptopurile și smartphone-urile, beneficiază acum de NPU-uri. De exemplu, laptopurile Copilot+ de la Microsoft sunt dotate cu un NPU puternic care va alimenta funcții precum Recall, o caracteristică ce va fi disponibilă în curând.
Funcția Recall realizează capturi de ecran, prelucrează datele pe dispozitiv folosind NPU-ul și generează un index vectorial. Dacă CPU-ul sau GPU-ul ar fi procesat aceste date, consumul bateriei ar fi fost semnificativ mai mare. Datorită NPU-ului dedicat, se pot efectua operațiuni AI fără a compromite durata de viață a bateriei sau a solicita excesiv CPU-ul sau GPU-ul.
În mod similar, NPU-urile sunt responsabile de funcționalități precum Cocreator în MS Paint, generarea de imagini în aplicația Photos, eliminarea fundalului din clipuri video, aplicarea efectelor vizuale folosind Magic Mask în DaVinci Resolve, upscaling-ul cadrelor în jocuri, aplicarea efectelor Windows Studio, generarea de traduceri și transcrieri în timp real și multe altele.
Este clar că aplicațiile NPU-urilor se vor extinde în timp, eliberând CPU-ul și GPU-ul de sarcini suplimentare, ceea ce va face dispozitivele mai rapide și eficiente energetic.
Apple, la rândul său, utilizează Neural Engine pentru a susține diverse funcții de inteligență artificială pe iOS, iPadOS și macOS. Acest model de AI on-device folosește Neural Engine pentru a rezuma email-uri, a prioritiza notificări, a genera sinteze ale înregistrărilor de apeluri, a crea imagini și multe altele. Noua Siri, de asemenea, beneficiază de Neural Engine pentru a gestiona numeroase sarcini AI.
Concluzii
În esență, NPU este un accelerator hardware inovator care deschide noi posibilități în era inteligenței artificiale. Această tehnologie abia începe să fie explorată, iar noi aplicații și experiențe bazate pe NPU vor apărea în viitorul apropiat. Cu un viitor promițător, NPU-urile vor schimba modul în care interacționăm cu tehnologia în moduri neașteptate.