Hoe herkennen apps die nummers herkennen, zoals Shazam?

Spectrogram

Shazam en bedrijf zijn een van de meest verbazingwekkende applicaties geworden die we op een smartphone kunnen dragen. En het is niet dat ze niet beroemd zijn, want iedereen kent ze al, maar het lijkt nog steeds bijna magisch dat ze elk moment kunnen herkennen welk nummer er wordt afgespeeld. Laten we eens kijken hoe apps zoals Shazam echt werken.

Spectrografie, de essentiële pijler

In werkelijkheid zijn deze toepassingen gebaseerd op wat we kennen als spectrografie, of spectroscopie, dat wil zeggen, het geheel van kennis met betrekking tot spectroscopische analyse. En met deze woorden kan het moeilijk te begrijpen zijn, maar we zullen het zo meteen uitleggen. Wanneer enig geluid wordt geproduceerd, kunnen we het horen omdat de deeltjes die zich tussen ons en de bron van dat geluid bevinden, bewegen, trillen. Als we zeggen dat deze deeltjes bewegen, bedoelen we dat ze golven genereren die van de ene plaats naar de andere gaan. Het aantal keren dat deze deeltjes heen en weer bewegen wordt de frequentie genoemd, en we hebben vast allemaal wel eens gehoord van de frequentie van een geluid, toch? Welnu, spectrografie is in dit geval gewijd aan het meten van de frequentie van geluiden in een bepaalde periode. Elk geluid heeft op elk moment een andere frequentie, en dat stelt ons in staat om op een spectrogram te onderscheiden welke geluiden klinken.

Het draait allemaal om vergelijken

Hoe weet je welk nummer wordt afgespeeld? vergelijken. Eigenlijk is het alsof je een "röntgenfoto" maakt en deze vergelijkt met andere röntgenfoto's van geluiden die we al hadden opgeslagen, zodat we kunnen weten welke van alle overeenkomt met die. Nou, dat is precies hoe Shazam en andere apps werken.

Spectrogram

Shazam is een spectrograaf

Wanneer we Shazam starten en het ons vertelt dat het het nummer herkent, verandert het onze smartphone in een spectrograaf. Het is het vastleggen van het geluid en het genereren van een spectrogram zoals je net boven deze paragraaf hebt. Als je eenmaal een voldoende gedetailleerde spectrograaf hebt, ga je deze vergelijken met de hele database die ze hebben opgeslagen.

De database is de meest complexe

In werkelijkheid is de meest complexe van allemaal de database die de spectrogrammen van alle nummers opslaat. We weten hoe moeilijk het is om een ​​muziekservice te maken die alle muziek van de wereld bevat. Spotify is een van die programma's, maar er ontbreken nog belangrijke nummers in. Nou, als dat al ingewikkeld is, stel je dan eens voor hoe het moet zijn om de spectrogrammen van al die nummers op te slaan. Het is normaal dat een deel van het werk van het team van Shazam en andere soortgelijke applicaties is om zich te wijden aan het uitbreiden van de database die in feite het hart van de applicatie is.

De offline werking is heel eenvoudig

Soms vragen we ons misschien af ​​hoe deze applicaties offline kunnen werken, zonder internetverbinding. Het is eigenlijk heel eenvoudig, omdat ze ons de gegevens pas geven als ze zijn verbonden met internet. Ze hoeven niet het hele nummer op te slaan, ze hoeven niet eens het muziekstuk op te slaan dat we willen analyseren. In werkelijkheid houden ze alleen de spectrografische gegevens bij, zodat ze later in de database kunnen worden vergeleken, en dat neemt praktisch niets in beslag.

Het algoritme is essentieel

Een ander van de belangrijkste aspecten van deze applicaties is echter het algoritme dat ze gebruiken om nummers te vergelijken. Een algoritme is in werkelijkheid niets meer dan een manier om een ​​procedure uit te voeren. Het algoritme van Shazam moet voortdurend worden verbeterd. Waarom? Omdat ze moeten werken om het systeem een ​​pad te laten volgen waardoor het het nummer nog sneller kan vinden. En het is dat men kan denken dat zodra de spectrogrammen zijn begrepen en de database met liedjes is voltooid, alles is gedaan, maar niets is minder waar. Laten we denken dat je het spectrogram moet vergelijken met miljoenen en miljoenen nummers. Het algoritme is echter een van de belangrijkste aspecten. Er zijn verschillende computertechnieken om dit te verbeteren, en we gaan er niet over een in het bijzonder praten, omdat het zou zijn als praten over de vorm van de wolken op een stormachtige dag. Het is echter altijd goed om te weten dat het algoritme van de applicatie een van de essentiële elementen is, samen met de spectrografiefunctie en die van de songdatabase.


  1.   de kliniek zei

    Chazam zuigt. Het is zooooo veel beter Soundhound of track ID van Sony.


  2.   de beat zei

    Interessant…