Paano gumagana ang mga app na kumikilala ng mga kanta, tulad ng Shazam?

Spectrogram

Ang Shazam at ang kumpanya ay naging isa sa mga pinakakahanga-hangang application na maaari naming dalhin sa isang smartphone. At hindi naman sa hindi sila sikat, dahil kilala na sila ng lahat, pero parang magic pa rin na nakikilala nila kung aling kanta ang tumutugtog sa anumang oras. Tingnan natin kung paano gumagana ang mga app tulad ng Shazam.

Spectrography, ang mahalagang haligi

Sa katotohanan, ang mga application na ito ay batay sa kung ano ang alam natin bilang spectrography, o spectroscopy, iyon ay, ang katawan ng kaalaman na nauugnay sa spectroscopic analysis. At sa mga salitang ito ay maaaring mahirap unawain ngunit ipapaliwanag natin ito sa isang sandali. Kapag nalikha ang anumang tunog, maririnig natin ito dahil ang mga particle na nasa pagitan natin at ang pinagmulan ng tunog na iyon ay gumagalaw, nag-vibrate. Kapag sinabi natin na ang mga particle na ito ay gumagalaw, ibig sabihin ay bumubuo sila ng mga alon, na pumupunta mula sa isang lugar patungo sa isa pa. Ang dami ng beses na gumagalaw ang mga particle na ito pabalik-balik ay tinatawag na frequency, at tiyak na narinig nating lahat ang frequency ng isang tunog, tama ba? Well, spectrography, sa kasong ito, ay nakatuon sa pagsukat ng dalas ng mga tunog sa isang tiyak na tagal ng panahon. Ang bawat tunog ay may iba't ibang dalas sa bawat sandali, at nagbibigay-daan ito sa amin na makilala, sa isang spectrogram, kung aling mga tunog ang tumutunog.

Ang lahat ng ito ay isang bagay ng paghahambing

Paano mo malalaman kung anong kanta ang tumutugtog? Paghahambing. Sa totoo lang, ito ay tulad ng pagkuha ng isang "X-ray" at paghahambing nito sa iba pang mga X-ray ng mga tunog na na-imbak na namin, upang malaman kung alin sa lahat ang tumutugma sa isang iyon. Iyan ay eksakto kung paano gumagana ang Shazam at iba pang mga app.

Spectrogram

Ang Shazam ay isang spectrograph

Kapag sinimulan namin ang Shazam, at sinasabi nito sa amin na kinikilala nito ang kanta, ang aktwal na ginagawa nito ay ginagawang spectrograph ang aming smartphone. Kinukuha nito ang tunog at bumubuo ng spectrogram tulad ng nasa itaas mo lang ng talatang ito. Kapag mayroon kang isang sapat na detalyadong spectrograph, pagkatapos ay ihahambing mo ito sa buong database na kanilang naimbak.

Ang database ay ang pinaka kumplikado

Sa totoo lang, ang pinaka-kumplikado sa lahat ay ang database na nag-iimbak ng spectrograms ng lahat ng kanta. Alam namin kung gaano kahirap gumawa ng serbisyo ng musika na naglalaman ng lahat ng musika sa mundo. Ang Spotify ay isa sa mga programang iyon, ngunit nawawala pa rin ang mahahalagang kanta mula rito. Buweno, kung ito ay kumplikado na, isipin kung ano ang dapat na tulad ng pag-imbak ng mga spectrograms ng lahat ng mga kantang iyon. Normal na bahagi ng gawain ng koponan ng Shazam at iba pang katulad na mga application ang italaga upang palawakin ang database na, sa katunayan, ang puso ng application.

Ang offline na operasyon nito ay napaka-simple

Minsan maaari tayong magtaka kung paano gumagana ang mga application na ito nang offline, nang walang koneksyon sa Internet. Ito ay talagang napaka-simple, dahil hindi nila kami binibigyan ng data hangga't hindi sila nakakonekta sa Internet. Hindi nila kailangang i-save ang buong kanta, hindi na nila kailangang i-save ang piraso ng musika na gusto nating suriin. Sa katotohanan, ang tanging bagay na kanilang itinatago ay ang spectrographic data, upang sa paglaon ay maikumpara sila sa database, at iyon ay halos wala.

Ang algorithm ay mahalaga

Gayunpaman, isa pa sa pinakamahalagang aspeto ng mga application na ito ay ang algorithm na ginagamit nila upang ihambing ang mga kanta. Ang isang algorithm, sa katotohanan, ay walang iba kundi isang paraan ng pagsasagawa ng isang pamamaraan. Ang algorithm ng Shazam ay dapat na patuloy na bumubuti. Bakit? Dahil kailangan nilang magtrabaho para sundan ng system ang isang landas na nagbibigay-daan dito upang mahanap ang kanta nang mas mabilis. At ito ay maaaring isipin ng isang tao na kapag ang spectrograms ay naiintindihan at ang database ng mga kanta ay nakumpleto, ang lahat ay tapos na, ngunit wala nang higit pa sa katotohanan. Isipin natin na kailangan mong ihambing ang spectrogram sa milyun-milyon at milyon-milyong kanta. Gayunpaman, ang algorithm ay isa sa mga pangunahing aspeto. Mayroong ilang mga diskarte sa computer upang mapabuti ito, at hindi namin pag-uusapan ang alinman sa partikular dahil ito ay tulad ng pag-uusap tungkol sa hugis ng Ulap sa isang mabagyong araw. Gayunpaman, palaging magandang malaman na ang algorithm ng application ay isa sa mga mahahalagang elemento, kasama ang spectrography function, at ng database ng kanta.


  1.   ang klinik dijo

    Nakakainis si Chazam. Ito ay napakahusay na Soundhound o track ID mula sa Sony.


  2.   Ang beattle dijo

    Kagiliw-giliw…