Hvordan kan apps, der genkender sange, som Shazam?

Spektrogram

Shazam og virksomheden er blevet en af ​​de mest fantastiske applikationer, som vi kan bære på en smartphone. Og det er ikke fordi, de ikke er berømte, for alle kender dem allerede, men det virker stadig næsten magisk, at de er i stand til at genkende, hvilken sang der spilles på ethvert givet tidspunkt. Lad os se, hvordan apps som Shazam faktisk fungerer.

Spektrografi, den væsentlige søjle

I virkeligheden er disse applikationer baseret på det, vi kender som spektrografi eller spektroskopi, det vil sige den viden, der er relateret til spektroskopisk analyse. Og med disse ord kan det være svært at forstå, men vi vil forklare det om et øjeblik. Når en lyd produceres, kan vi høre den, fordi partiklerne, der er mellem os og kilden til den lyd, bevæger sig, vibrerer. Når vi siger, at disse partikler bevæger sig, mener vi, at de genererer bølger, som går fra et sted til et andet. Antallet af gange disse partikler bevæger sig frem og tilbage kaldes frekvensen, og vi har sikkert alle hørt om frekvensen af ​​en lyd, ikke? Nå, spektrografi, i dette tilfælde, er dedikeret til at måle frekvensen af ​​lyde i en vis periode. Hver lyd har en anden frekvens i hvert øjeblik, og det giver os mulighed for på et spektrogram at differentiere, hvilke lyde der lyder.

Det hele er et spørgsmål om at sammenligne

Hvordan ved du, hvilken sang der spilles? Sammenligner. Faktisk er det som at tage et "røntgenbillede" og sammenligne det med andre røntgenbilleder af lyde, som vi allerede havde gemt, og dermed være i stand til at vide, hvilken af ​​alle der matcher den. Det er præcis sådan, Shazam og andre apps fungerer.

Spektrogram

Shazam er en spektrograf

Når vi starter Shazam, og den fortæller os, at den genkender sangen, er det, den faktisk gør, at forvandle vores smartphone til en spektrograf. Det fanger lyden og genererer et spektrogram som det, du har lige over dette afsnit. Når du har en tilstrækkelig detaljeret spektrograf, så går du videre med at sammenligne den med hele den database, de har gemt.

Databasen er den mest komplekse

Faktisk er den mest komplekse af alt databasen, der gemmer spektrogrammerne for alle sangene. Vi ved, hvor svært det er at skabe en musiktjeneste, der indeholder al musikken i verden. Spotify er et af disse programmer, men der mangler stadig vigtige sange fra det. Nå, hvis det allerede er komplekst, så forestil dig, hvordan det må være at gemme spektrogrammerne for alle de sange. Det er normalt, at en del af arbejdet i teamet af Shazam og andre lignende applikationer er at dedikere til at udvide databasen, som faktisk er hjertet i applikationen.

Dens offline betjening er meget enkel

Nogle gange kan vi undre os over, hvordan disse applikationer kan fungere offline uden internetforbindelse. Det er faktisk meget enkelt, da de aldrig giver os dataene, før de er forbundet til internettet. De behøver ikke at gemme hele sangen, de behøver ikke engang at gemme det musikstykke, som vi vil analysere. I virkeligheden er det eneste, de opbevarer, de spektrografiske data, så de senere kan sammenlignes i databasen, og det fylder stort set ingenting.

Algoritmen er vigtig

Et andet af de vigtigste aspekter af disse applikationer er imidlertid den algoritme, de bruger til at sammenligne sange. En algoritme er i virkeligheden ikke andet end en måde at udføre en procedure på. Shazams algoritme skal konstant forbedres. Hvorfor? For de skal arbejde på at få systemet til at følge en sti, der gør det muligt at finde sangen endnu hurtigere. Og det er, at man kan tro, at når først spektrogrammerne er forstået, og sangdatabasen er færdig, er alt gjort, men intet er længere fra sandheden. Lad os tro, at du skal sammenligne spektrogrammet med millioner og atter millioner af sange. Algoritmen er dog et af hovedaspekterne. Der er flere computerteknikker til at forbedre dette, og vi vil ikke tale om nogen særlig, fordi det ville være som at tale om formen på skyerne på en stormfuld dag. Det er dog altid godt at vide, at applikationens algoritme er et af de væsentlige elementer sammen med spektrografifunktionen og sangdatabasen.


  1.   klinikken sagde han

    Chazam stinker. Det er såååå meget bedre Soundhound eller track ID fra Sony.


  2.   Beatlen sagde han

    Interessant…