Cum funcționează aplicațiile de identificare muzicală precum Shazam?

Aplicațiile de identificare a muzicii par a fi magice la început, dar sub capotă este un algoritm sofisticat care poate găsi melodii într-o clipă. Iată cum funcționează.

Magia identificării muzicii

Probabil ni s-a întâmplat tuturor. Iei cina la un restaurant drăguț, ieși la o cafenea sau te plimbi într-un magazin, când auzi dintr-o dată o melodie grozavă cântând în difuzoare. Poate că este o melodie pe care ai mai ascultat-o ​​sau o piesă pe care nu ai mai auzit-o niciodată. Deci, scoateți telefonul, deschideți Shazam și ridicați dispozitivul în tavan. Într-o clipită, aplicația vă spune ce este melodia, cine este artistul și unde să o transmiteți în flux.

Sunt rapide, remarcabil de precise și pot identifica chiar și cele mai obscure cântece. Pe scurt, aceștia funcționează izolând melodia dintr-o înregistrare și căutându-l într-o bază de date extinsă de piese. Dar tehnologia din spatele modului în care fac acest lucru este destul de complexă și impresionantă.

S-ar putea să fii șocat să știi că aplicația Shazam pe care o știm astăzi a fost lansată în 2002, iar sistemul era la fel de precis și de rapid atunci ca și acum. Asta se datorează unui algoritm unic care ar revoluționa lumea muzicii.

Nu sunt doar versurile

La prima vedere, aplicațiile de identificare a muzicii precum Shazam pot părea simple. S-ar putea să credeți că doar ascultă versurile, la fel ca orice asistent vocal, și le caută într-o bază de date cu versuri pentru a vă spune care este melodia.

  Alegeți ce evenimente adaugă automat Outlook Online la calendarul dvs

Cu toate acestea, majoritatea aplicațiilor de identificare a muzicii sunt capabile să spună care este titlul unui instrument sau chiar cântărețul unei melodii. Asta pentru că, în loc să analizeze versurile piesei, ei caută „amprente” care sunt unice pentru fiecare melodie în bazele lor extinse de date.

Tehnologia de amprentare

Probabil că aveți dispozitive care pot fi deblocate folosind amprenta dvs., care este aranjarea liniilor mici de pe deget, care sunt unice pentru dvs. În mod similar, atunci când țineți microfonul pentru a înregistra un scurt clip al unei melodii, acest clip se transformă în modele de date pe care Shazam sau o altă aplicație le poate căuta în baza lor de date.

La prima vedere, această metodă pare predispusă la mai multe probleme. De cele mai multe ori când auziți muzică în public, există zgomot de fundal și distorsiuni cauzate de difuzoare, care pot face melodiile neidentificabile sau pot duce la potriviri inexacte. De asemenea, există o mulțime de date capturate chiar și într-un clip audio scurt, ceea ce poate face căutarea acestor modele într-o bază de date de milioane de melodii.

Într-un interviu cu științific american în 2003, Avery Li-Chun Wang, cercetătorul șef al datelor și co-fondatorul Shazam, explică modul în care algoritmul lor rezolvă aceste probleme. Informațiile unui clip audio pot fi vizualizate cu o diagramă 3D cunoscută sub numele de spectrogramă, care reprezintă o modificare a frecvențelor într-o perioadă de timp. De asemenea, ia în considerare amplitudinea, care este cât de puternic este un sunet. Aceasta este reprezentată într-o spectrogramă folosind intensitatea culorii.

  Cum să numărați criteriile setului de potrivire a datelor în Foi de calcul Google

În același mod în care oamenii nu pot percepe sunetul decât dacă se află la o anumită frecvență, în loc să ia în considerare întregul cântec atunci când efectuează o căutare, Shazam ia doar „vârfurile”, care este cel mai mare conținut de energie dintr-un clip audio. . Amprentele digitale pe care le captează preiau doar punctele de cea mai înaltă frecvență într-un interval de timp dat și apoi punctele de amplitudine maximă în acele frecvențe.

Într-o lucrare de cercetare pentru Universitatea Columbia, Wang a declarat că metoda le permite să elimine majoritatea părților inutile ale unui clip audio, cum ar fi zgomotul de fundal, și să elimine distorsiunile. De asemenea, face ca dimensiunea printurilor să fie suficient de mică încât să fie nevoie de doar milisecunde pentru a identifica o melodie în baza lor vastă.

Impactul lui Shazam

Pe lângă faptul că sunt utile pentru ascultătorii obișnuiți care aud un cântec care le place, aplicațiile de identificare a muzicii ajută și la modelarea lumii muzicii.

Posturile de radio și serviciile de streaming folosesc adesea datele despre ce oameni sunt Shazam cel mai mult pentru a afla ce melodii sunt ascultate de public. Acest lucru este util deoarece indică atractivitatea și popularitatea potențială a unei melodii, indiferent de artist. Când identificați o melodie cu aplicația, veți vedea imediat câți oameni au încercat să o identifice.

De la apariția lui Shazam, au apărut și o mână de concurenți. Soundhound pretinde că poate identifica o melodie pur și simplu cântând sau fredonând la ea, cu rezultate mixte. Există, de asemenea, un identificator de melodie integrat cu aplicații vocale, cum ar fi Google Assistant, care funcționează foarte similar cu sistemul Shazam.

  Puteți obține Warzone Aimbot pe Xbox One?