Si funksionojnë aplikacionet që njohin këngë, si Shazam?

Spektrogrami

Shazam dhe kompania janë bërë një nga ato aplikacionet më të mahnitshme që mund të mbajmë në një smartphone. Dhe nuk është se nuk janë të famshëm, sepse tashmë të gjithë i njohin, por gjithsesi duket thuajse magjike që ata janë në gjendje të dallojnë se cila këngë po luhet në çdo moment. Le të shohim se si funksionojnë në të vërtetë aplikacionet si Shazam.

Spektrografia, shtylla thelbësore

Në realitet, këto aplikacione bazohen në atë që ne e njohim si spektrografi, ose spektroskopi, që është, trupi i njohurive që lidhen me analizën spektroskopike. Dhe me këto fjalë mund të jetë e vështirë për t'u kuptuar, por ne do ta shpjegojmë atë në një moment. Kur prodhohet ndonjë tingull, ne mund ta dëgjojmë atë sepse grimcat që janë midis nesh dhe burimit të atij tingulli lëvizin, dridhen. Kur themi se këto grimca lëvizin, nënkuptojmë se ato gjenerojnë valë, të cilat shkojnë nga një vend në tjetrin. Numri i herëve që këto grimca lëvizin përpara dhe me radhë quhet frekuencë, dhe me siguri të gjithë kemi dëgjuar për frekuencën e një tingulli, apo jo? Epo, spektrografia, në këtë rast, i kushtohet matjes së frekuencës së tingujve në një periudhë të caktuar kohore. Çdo tingull ka një frekuencë të ndryshme në çdo moment, dhe kjo na lejon të dallojmë, në një spektrogram, se cilët tinguj tingëllojnë.

E gjitha është çështje krahasimi

Si e dini se cila këngë po luhet? Duke krahasuar. Në fakt, është si të marrësh një "rreze X" dhe ta krahasosh atë me rrezet e tjera X të tingujve që ne i kishim ruajtur tashmë, duke qenë në gjendje të dimë se cila nga të gjitha përputhet me atë. Epo, kjo është pikërisht mënyra se si funksionojnë Shazam dhe aplikacionet e tjera.

Spektrogrami

Shazam është një spektrograf

Kur ne fillojmë Shazam, dhe na thotë se po e njeh këngën, ajo që në të vërtetë po bën është ta kthejë telefonin inteligjent tonë në një spektrograf. Është kapja e tingullit dhe gjenerimi i një spektrogrami si ai që keni pikërisht sipër këtij paragrafi. Pasi të keni një spektrograf mjaft të detajuar, atëherë vazhdoni ta krahasoni atë me të gjithë bazën e të dhënave që ata kanë ruajtur.

Baza e të dhënave është më komplekse

Në fakt, më kompleksi nga të gjitha është baza e të dhënave që ruan spektrogramet e të gjitha këngëve. Ne e dimë se sa e vështirë është të krijosh një shërbim muzikor që përmban të gjithë muzikën në botë. Spotify është një nga ato programe, por ende mungojnë këngët e rëndësishme. Epo, nëse kjo tashmë është komplekse, imagjinoni se si duhet të jetë ruajtja e spektrogrameve të të gjitha atyre këngëve. Është normale që pjesë e punës së ekipit të Shazam dhe aplikacioneve të tjera të ngjashme është që t'i përkushtohet zgjerimit të bazës së të dhënave që, në fakt, është zemra e aplikacionit.

Funksionimi i tij offline është shumë i thjeshtë

Ndonjëherë mund të pyesim veten se si këto aplikacione mund të funksionojnë jashtë linje, pa një lidhje interneti. Në fakt është shumë e thjeshtë, pasi nuk na i japin kurrë të dhënat derisa të lidhen me internetin. Ata nuk kanë pse të ruajnë të gjithë këngën, nuk kanë pse të ruajnë as pjesën muzikore që duam të analizojmë. Në realitet, e vetmja gjë që ata mbajnë janë të dhënat spektrografike, në mënyrë që më vonë të mund të krahasohen në bazën e të dhënave, dhe kjo nuk kërkon pothuajse asgjë.

Algoritmi është thelbësor

Megjithatë, një nga aspektet më të rëndësishme të këtyre aplikacioneve është algoritmi që ata përdorin për të krahasuar këngët. Një algoritëm, në realitet, nuk është gjë tjetër veçse një mënyrë për të kryer një procedurë. Algoritmi i Shazam duhet të përmirësohet vazhdimisht. Pse? Sepse ata duhet të punojnë që sistemi të ndjekë një rrugë që e lejon atë të gjejë këngën edhe më shpejt. Dhe është se mund të mendohet se pasi të kuptohen spektrogramet dhe të plotësohet baza e të dhënave të këngëve, gjithçka është bërë, por asgjë nuk është më larg nga e vërteta. Le të mendojmë se duhet të krahasoni spektrogramin me miliona e miliona këngë. Megjithatë, algoritmi është një nga aspektet kryesore. Ka disa teknika kompjuterike për ta përmirësuar këtë, dhe ne nuk do të flasim për ndonjë në veçanti sepse do të ishte si të flasim për formën e Reve në një ditë me stuhi. Megjithatë, është gjithmonë mirë të dini se algoritmi i aplikacionit është një nga elementët thelbësorë, së bashku me funksionin e spektrografisë dhe atë të bazës së të dhënave të këngëve.


  1.   Elkliniko dijo

    Chazam thith. Është shumë më i mirë Soundhound ose ID-ja e këngës nga Sony.


  2.   Beattle dijo

    Interesante