Kako aplikacije, ki prepoznajo pesmi, kot je Shazam?

Spektrogram

Shazam in družba sta postala ena tistih najbolj neverjetnih aplikacij, ki jih lahko nosimo na pametnem telefonu. In ne, da niso slavni, saj jih že vsi poznajo, a vseeno se zdi skoraj čarobno, da znajo v danem trenutku prepoznati, katera pesem igra. Poglejmo, kako aplikacije, kot je Shazam, dejansko delujejo.

Spektrografija, bistveni steber

V resnici te aplikacije temeljijo na tem, kar poznamo kot spektrografija ali spektroskopija, to je zbirka znanja, povezana s spektroskopsko analizo. In s temi besedami je lahko težko razumeti, vendar bomo to razložili v trenutku. Ko se proizvede kateri koli zvok, ga lahko slišimo, ker se delci, ki so med nami in virom tega zvoka, premikajo, vibrirajo. Ko rečemo, da se ti delci premikajo, mislimo, da ustvarjajo valove, ki gredo z enega mesta na drugega. Kolikokrat se ti delci premikajo naprej in nazaj, se imenuje frekvenca in zagotovo smo vsi že slišali za frekvenco zvoka, kajne? No, spektrografija je v tem primeru namenjena merjenju frekvence zvokov v določenem časovnem obdobju. Vsak zvok ima v vsakem trenutku drugačno frekvenco, kar nam omogoča, da na spektrogramu ločimo, kateri zvoki zvenijo.

Vse gre za primerjavo

Kako veš, katera pesem se predvaja? Primerjava. Pravzaprav je tako, kot da bi vzeli "rentgenski posnetek" in ga primerjali z drugimi rentgenskimi posnetki zvokov, ki smo jih že shranili, in tako lahko vedeli, kateri od vseh se ujema s tem. No, točno tako delujejo Shazam in druge aplikacije.

Spektrogram

Shazam je spektrograf

Ko zaženemo Shazam in nam pove, da prepozna pesem, pravzaprav spremeni naš pametni telefon v spektrograf. Zajame zvok in ustvari spektrogram, kot je tisti, ki ga imate tik nad tem odstavkom. Ko imate dovolj podroben spektrograf, ga nato primerjate s celotno bazo podatkov, ki so jo shranili.

Baza podatkov je najbolj zapletena

Pravzaprav je najbolj zapletena baza podatkov, ki shranjuje spektrograme vseh pesmi. Vemo, kako težko je ustvariti glasbeno storitev, ki vsebuje vso glasbo na svetu. Spotify je eden od teh programov, vendar v njem še vedno manjkajo pomembne pesmi. No, če je to že zapleteno, si predstavljajte, kako mora biti shranjevanje spektrogramov vseh teh pesmi. Normalno je, da se del dela ekipe Shazam in drugih podobnih aplikacij posveti razširitvi baze podatkov, ki je pravzaprav srce aplikacije.

Njegovo delovanje brez povezave je zelo preprosto

Včasih se lahko vprašamo, kako lahko te aplikacije delujejo brez povezave, brez internetne povezave. Pravzaprav je zelo preprosto, saj nam nikoli ne dajo podatkov, dokler niso povezani z internetom. Ni jim treba shraniti celotne skladbe, niti ni treba shraniti skladbe, ki jo želimo analizirati. V resnici so edino, kar hranijo, spektrografski podatki, da bi jih kasneje lahko primerjali v bazi podatkov, kar pa praktično nič ne vzame.

Algoritem je bistven

Vendar pa je še en najpomembnejši vidik teh aplikacij algoritem, ki ga uporabljajo za primerjavo pesmi. Algoritem v resnici ni nič drugega kot način izvajanja postopka. Shazamov algoritem se mora nenehno izboljševati. Zakaj? Ker si morajo prizadevati, da sistem sledi poti, ki mu omogoča, da še hitreje najde pesem. In to je, da je mogoče misliti, da je vse narejeno, ko so spektrogrami razumljeni in je zbirka skladb dokončana, a nič ne more biti dlje od resnice. Recimo, da bi morali primerjati spektrogram z milijoni in milijoni pesmi. Vendar pa je algoritem eden glavnih vidikov. Obstaja več računalniških tehnik za izboljšanje tega, o nobeni pa ne bomo govorili posebej, ker bi bilo tako, kot da bi govorili o obliki oblakov na nevihten dan. Vedno pa je dobro vedeti, da je algoritem aplikacije eden od bistvenih elementov, poleg spektrografske funkcije in baze skladb.


  1.   klinika je dejal

    Chazam je zanič. To je takoooooooooooooooooooooooooooooooooooo boljši Soundhound ali ID skladbe od Sonyja.


  2.   Beattle je dejal

    Zanimivo ...