Kako aplikacije koje prepoznaju pjesme, poput Shazama?

Spektrogram

Shazam i društvo postali su jedna od onih najnevjerojatnijih aplikacija koje možemo nositi na pametnom telefonu. I nije da nisu poznati, jer ih već svi znaju, ali se ipak čini gotovo magično da u svakom trenutku mogu prepoznati koja pjesma svira. Pogledajmo kako aplikacije poput Shazama zapravo rade.

Spektrografija, osnovni stup

U stvarnosti, te se primjene temelje na onome što znamo kao spektrografija, odnosno spektroskopija, odnosno na skupu znanja vezanog za spektroskopsku analizu. I s ovim riječima može biti teško razumjeti, ali objasnit ćemo to za trenutak. Kada se proizvede bilo koji zvuk, možemo ga čuti jer se čestice koje su između nas i izvora tog zvuka kreću, vibriraju. Kada kažemo da se te čestice kreću, mislimo da one stvaraju valove, koji idu s jednog mjesta na drugo. Broj pomicanja ovih čestica naprijed-natrag naziva se frekvencijom, a zasigurno smo svi čuli za frekvenciju zvuka, zar ne? Pa, spektrografija je u ovom slučaju posvećena mjerenju frekvencije zvukova u određenom vremenskom razdoblju. Svaki zvuk u svakom trenutku ima drugačiju frekvenciju i to nam omogućuje da na spektrogramu razlikujemo koji zvukovi zvuče.

Sve je stvar usporedbe

Kako znaš koja pjesma svira? Uspoređujući. Zapravo, to je kao da uzmete "X-zraku" i uspoređujete je s drugim X-zrakama zvukova koje smo već pohranili i tako možemo znati koji od svih odgovara tom. Pa upravo tako funkcioniraju Shazam i druge aplikacije.

Spektrogram

Shazam je spektrograf

Kada pokrenemo Shazam, a on nam kaže da prepoznaje pjesmu, ono što zapravo radi je pretvaranje našeg pametnog telefona u spektrograf. Zahvaća zvuk i generira spektrogram poput onog koji imate neposredno iznad ovog odlomka. Nakon što imate dovoljno detaljan spektrograf, onda ga uspoređujete s cijelom bazom podataka koju su pohranili.

Baza podataka je najsloženija

Zapravo, najsloženija od svega je baza podataka koja pohranjuje spektrograme svih pjesama. Znamo koliko je teško stvoriti glazbeni servis koji sadrži svu glazbu svijeta. Spotify je jedan od tih programa, ali u njemu još uvijek nedostaju važne pjesme. Pa, ako je to već složeno, zamislite kako mora biti pohranjivanje spektrograma svih tih pjesama. Normalno je da se dio posla tima Shazama i drugih sličnih aplikacija posveti proširenju baze podataka koja je, zapravo, srce aplikacije.

Njegov izvanmrežni rad vrlo je jednostavan

Ponekad se možemo zapitati kako ove aplikacije mogu raditi izvan mreže, bez internetske veze. Zapravo je vrlo jednostavno, jer nam nikada ne daju podatke dok se ne spoje na internet. Ne moraju spremati cijelu pjesmu, ne moraju čak ni skladbu koju želimo analizirati. U stvarnosti, jedino što čuvaju su spektrografski podaci, kako bi se kasnije mogli uspoređivati ​​u bazi podataka, a to praktički ništa ne zauzima.

Algoritam je bitan

Međutim, još jedan od najvažnijih aspekata ovih aplikacija je algoritam koji koriste za usporedbu pjesama. Algoritam, u stvarnosti, nije ništa drugo nego način izvođenja postupka. Shazam algoritam se mora stalno poboljšavati. Zašto? Zato što moraju raditi na tome da sustav slijedi put koji mu omogućuje da još brže pronađe pjesmu. A to je da se može misliti da je, nakon što se shvate spektrogrami i dovrši baza podataka pjesama, sve gotovo, ali ništa ne može biti dalje od istine. Zamislimo da morate usporediti spektrogram s milijunima i milijunima pjesama. Međutim, algoritam je jedan od glavnih aspekata. Postoji nekoliko računalnih tehnika koje to mogu poboljšati, a nećemo govoriti ni o jednoj posebno jer bi to bilo kao da govorimo o obliku Oblaka u olujnom danu. No, uvijek je dobro znati da je algoritam aplikacije jedan od bitnih elemenata, uz spektrografsku funkciju i bazu pjesama.


  1.   klinika dijo

    Chazam je sranje. Mnogo je bolji Soundhound ili ID pjesme od Sonyja.


  2.   Beattle dijo

    Zanimljiv…