Kā lietotnes, kas atpazīst dziesmas, piemēram, Shazam?

Spektrogramma

Shazam un uzņēmums ir kļuvuši par vienu no pārsteidzošākajām lietojumprogrammām, ko mēs varam nēsāt viedtālrunī. Un nav jau tā, ka viņi nebūtu slaveni, jo visi jau viņus pazīst, bet tomēr šķiet gandrīz vai maģiski, ka viņi jebkurā brīdī spēj atpazīt, kāda dziesma skan. Apskatīsim, kā patiesībā darbojas tādas lietotnes kā Shazam.

Spektrogrāfija, galvenais pīlārs

Patiesībā šīs lietojumprogrammas ir balstītas uz to, ko mēs zinām kā spektrogrāfiju vai spektroskopiju, tas ir, zināšanu kopumu, kas saistīts ar spektroskopisko analīzi. Un ar šiem vārdiem to var būt grūti saprast, bet mēs to izskaidrosim pēc brīža. Kad tiek radīta jebkura skaņa, mēs to varam dzirdēt, jo daļiņas, kas atrodas starp mums un šīs skaņas avotu, kustas, vibrē. Kad mēs sakām, ka šīs daļiņas pārvietojas, mēs domājam, ka tās rada viļņus, kas iet no vienas vietas uz otru. To reižu skaitu, kad šīs daļiņas pārvietojas uz priekšu un atpakaļ, sauc par frekvenci, un mēs noteikti esam dzirdējuši par skaņas frekvenci, vai ne? Nu, spektrogrāfija šajā gadījumā ir veltīta skaņu frekvences mērīšanai noteiktā laika periodā. Katrai skaņai katrā brīdī ir atšķirīga frekvence, un tas ļauj mums spektrogrammā atšķirt, kuras skaņas skan.

Tas viss ir salīdzināšanas jautājums

Kā jūs zināt, kura dziesma tiek atskaņota? Salīdzinot. Patiesībā tas ir tāpat kā veikt "rentgena attēlu" un salīdzināt to ar citiem jau saglabātajiem skaņu rentgena stariem, tādējādi varot zināt, kurš no visiem atbilst šim. Tieši tā darbojas Shazam un citas lietotnes.

Spektrogramma

Shazam ir spektrogrāfs

Kad mēs startējam Shazam un tas mums saka, ka tā atpazīst dziesmu, tas, ko tas patiesībā dara, ir pārvērš mūsu viedtālruni par spektrogrāfu. Tā ir skaņas uztveršana un tādas spektrogrammas ģenerēšana, kāda jums ir tieši virs šīs rindkopas. Kad jums ir pietiekami detalizēts spektrogrāfs, varat to salīdzināt ar visu datu bāzi, ko tie ir saglabājuši.

Datubāze ir vissarežģītākā

Patiesībā vissarežģītākā no visām ir datu bāze, kurā tiek glabātas visu dziesmu spektrogrammas. Mēs zinām, cik grūti ir izveidot mūzikas pakalpojumu, kas satur visu pasaules mūziku. Spotify ir viena no šīm programmām, taču tajā joprojām trūkst svarīgu dziesmu. Nu, ja tas jau ir sarežģīti, iedomājieties, kā tam vajadzētu būt, lai saglabātu visu šo dziesmu spektrogrammas. Ir normāli, ka daļa no Shazam un citu līdzīgu lietojumprogrammu komandas darba ir veltīta datu bāzes paplašināšanai, kas patiesībā ir lietojumprogrammas sirds.

Tās bezsaistes darbība ir ļoti vienkārša

Dažreiz mēs varam brīnīties, kā šīs lietojumprogrammas var darboties bezsaistē, bez interneta savienojuma. Patiesībā tas ir ļoti vienkārši, jo viņi nekad nesniedz mums datus, kamēr nav izveidots savienojums ar internetu. Viņiem nav jāsaglabā visa dziesma, viņiem pat nav jāsaglabā skaņdarbs, kuru mēs vēlamies analizēt. Patiesībā vienīgais, ko viņi glabā, ir spektrogrāfiskie dati, lai vēlāk tos varētu salīdzināt datu bāzē, un tas praktiski neko neaizņem.

Algoritms ir būtisks

Tomēr vēl viens no svarīgākajiem šo lietojumprogrammu aspektiem ir algoritms, ko tās izmanto dziesmu salīdzināšanai. Algoritms patiesībā nav nekas cits kā procedūras veikšanas veids. Shazam algoritms ir pastāvīgi jāuzlabo. Kāpēc? Jo viņiem ir jāstrādā, lai sistēma iet pa ceļu, kas ļauj tai atrast dziesmu vēl ātrāk. Un ir tā, ka var domāt, ka, kad spektrogrammas ir saprastas un dziesmu datubāze ir pabeigta, viss ir izdarīts, bet nekas nav tālāk no patiesības. Padomāsim, ka spektrogrammu vajadzētu salīdzināt ar miljoniem un miljoniem dziesmu. Tomēr algoritms ir viens no galvenajiem aspektiem. Lai to uzlabotu, ir vairākas datortehnikas, un mēs nerunāsim par tām īpaši, jo tas būtu tāpat kā runāt par Mākoņu formu vētrainā dienā. Tomēr vienmēr ir labi zināt, ka lietojumprogrammas algoritms ir viens no būtiskiem elementiem, kā arī spektrogrāfijas funkcija un dziesmu datu bāzes funkcija.


  1.   klīnika teica

    Čazams ir sūdīgs. Tas ir ļoti daudz labāks Soundhound vai ieraksta ID no Sony.


  2.   Bītls teica

    Interesanti ...