Ako fungujú aplikácie, ktoré rozpoznávajú skladby, napríklad Shazam?

Spektrogram

Shazam a spol sa stali jednou z najúžasnejších aplikácií, ktoré môžeme nosiť na smartfóne. Nie je to tak, že by neboli slávni, veď ich už každý pozná, no aj tak sa zdá takmer čarovné, že sú schopní rozpoznať, ktorá pesnička sa práve hrá. Pozrime sa, ako vlastne fungujú aplikácie ako Shazam.

Spektrografia, základný pilier

V skutočnosti sú tieto aplikácie založené na tom, čo poznáme ako spektrografiu alebo spektroskopiu, teda na súbore poznatkov súvisiacich so spektroskopickou analýzou. A pri týchto slovách to môže byť ťažké pochopiť, ale o chvíľu si to vysvetlíme. Keď sa vytvorí akýkoľvek zvuk, môžeme ho počuť, pretože častice, ktoré sú medzi nami a zdrojom tohto zvuku, sa pohybujú, vibrujú. Keď hovoríme, že sa tieto častice pohybujú, myslíme tým, že vytvárajú vlny, ktoré prechádzajú z jedného miesta na druhé. Počet pohybov týchto častíc tam a späť sa nazýva frekvencia a určite sme už všetci počuli o frekvencii zvuku, však? Spektrografia je v tomto prípade venovaná meraniu frekvencie zvukov v určitom časovom úseku. Každý zvuk má v každom okamihu inú frekvenciu, a to nám umožňuje na spektrograme rozlíšiť, ktoré zvuky znejú.

Všetko je to vec porovnávania

Ako vieš, aká pesnička hrá? Porovnávanie. V skutočnosti je to ako urobiť „röntgenový snímok“ a porovnať ho s inými röntgenovými snímkami zvukov, ktoré už máme uložené, a tak vedieť, ktorý zo všetkých sa s tým zhoduje. Presne takto funguje Shazam a ďalšie aplikácie.

Spektrogram

Shazam je spektrograf

Keď spustíme Shazam a ten nám povie, že rozpoznáva skladbu, v skutočnosti to robí, že premení náš smartfón na spektrograf. Zachytáva zvuk a generuje spektrogram podobný tomu, ktorý máte práve nad týmto odsekom. Keď máte dostatočne podrobný spektrograf, potom ho porovnáte s celou databázou, ktorú majú uloženú.

Databáza je najkomplexnejšia

V skutočnosti je najkomplexnejšia databáza, v ktorej sú uložené spektrogramy všetkých skladieb. Vieme, aké ťažké je vytvoriť hudobnú službu, ktorá obsahuje všetku hudbu na svete. Spotify je jedným z týchto programov, ale dôležité skladby v ňom stále chýbajú. No, ak je to už zložité, predstavte si, aké to musí byť ukladať spektrogramy všetkých tých skladieb. Je normálne, že súčasťou práce tímu Shazam a iných podobných aplikácií je venovať sa rozširovaniu databázy, ktorá je v skutočnosti srdcom aplikácie.

Jeho offline prevádzka je veľmi jednoduchá

Niekedy by nás mohlo zaujímať, ako môžu tieto aplikácie fungovať offline, bez pripojenia na internet. V skutočnosti je to veľmi jednoduché, pretože nám nikdy neposkytnú údaje, kým nie sú pripojení na internet. Nemusia uložiť celú skladbu, dokonca nemusia uložiť skladbu, ktorú chceme analyzovať. V skutočnosti jediné, čo uchovávajú, sú spektrografické údaje, aby sa neskôr dali porovnať v databáze, a to nezaberá prakticky nič.

Algoritmus je nevyhnutný

Ďalším z najdôležitejších aspektov týchto aplikácií je však algoritmus, ktorý používajú na porovnávanie skladieb. Algoritmus v skutočnosti nie je nič iné ako spôsob vykonania postupu. Shazamov algoritmus sa musí neustále zlepšovať. prečo? Pretože musia pracovať na tom, aby systém priviedol k ceste, ktorá mu umožní nájsť skladbu ešte rýchlejšie. A je to tak, že si človek môže myslieť, že po pochopení spektrogramov a dokončení databázy skladieb je všetko hotové, ale nič nie je ďalej od pravdy. Predpokladajme, že musíte porovnať spektrogram s miliónmi a miliónmi skladieb. Algoritmus je však jedným z hlavných aspektov. Existuje niekoľko počítačových techník na zlepšenie tohto stavu a nebudeme hovoriť o žiadnej konkrétnej, pretože by to bolo ako hovoriť o tvare mrakov počas búrkového dňa. Vždy je však dobré vedieť, že algoritmus aplikácie je spolu so spektrografickou funkciou a databázou skladieb jedným zo základných prvkov.


  1.   klinika dijo

    Chazam je na hovno. Je to oveľa lepšie Soundhound alebo ID stopy od Sony.


  2.   Bitka dijo

    Zaujímavé…