Bagaimanakah apl yang mengenali lagu, seperti Shazam?

Spektrogram

Shazam dan syarikat telah menjadi salah satu aplikasi paling menakjubkan yang boleh kami bawa pada telefon pintar. Dan bukanlah mereka tidak terkenal, kerana semua orang sudah mengenali mereka, tetapi nampaknya hampir ajaib bahawa mereka dapat mengenali lagu yang dimainkan pada bila-bila masa. Mari lihat cara aplikasi seperti Shazam sebenarnya berfungsi.

Spektrografi, tiang penting

Pada hakikatnya, aplikasi ini adalah berdasarkan apa yang kita kenali sebagai spektrografi, atau spektroskopi, iaitu badan pengetahuan yang berkaitan dengan analisis spektroskopi. Dan dengan kata-kata ini ia boleh menjadi sukar untuk difahami tetapi kami akan menerangkannya sebentar lagi. Apabila apa-apa bunyi dihasilkan, kita boleh mendengarnya kerana zarah yang berada di antara kita dan sumber bunyi itu bergerak, bergetar. Apabila kita mengatakan bahawa zarah-zarah ini bergerak, kita bermaksud bahawa ia menghasilkan gelombang, yang pergi dari satu tempat ke tempat lain. Bilangan kali zarah ini bergerak ke sana ke mari dipanggil frekuensi, dan pastinya kita semua pernah mendengar tentang frekuensi bunyi, bukan? Nah, spektrografi, dalam kes ini, didedikasikan untuk mengukur kekerapan bunyi dalam tempoh masa tertentu. Setiap bunyi mempunyai frekuensi yang berbeza pada setiap saat, dan itu membolehkan kita membezakan, pada spektrogram, bunyi yang berbunyi.

Ini semua tentang membandingkan

Bagaimana anda tahu lagu yang dimainkan? Membandingkan. Sebenarnya, ia seperti mengambil "X-ray" dan membandingkannya dengan X-ray bunyi lain yang telah kami simpan, sekali gus dapat mengetahui yang mana padan dengan bunyi itu. Itulah cara Shazam dan aplikasi lain berfungsi.

Spektrogram

Shazam ialah spektrograf

Apabila kita memulakan Shazam, dan ia memberitahu kita bahawa ia mengiktiraf lagu itu, apa yang sebenarnya dilakukannya ialah menukar telefon pintar kita menjadi spektrograf. Ia menangkap bunyi dan menjana spektrogram seperti yang anda ada di atas perenggan ini. Sebaik sahaja anda mempunyai spektrograf yang cukup terperinci, maka anda terus membandingkannya dengan keseluruhan pangkalan data yang telah mereka simpan.

Pangkalan data adalah yang paling kompleks

Sebenarnya, yang paling kompleks adalah pangkalan data yang menyimpan spektrogram semua lagu. Kami tahu betapa sukarnya untuk mencipta perkhidmatan muzik yang mengandungi semua muzik di dunia. Spotify ialah salah satu program tersebut, tetapi lagu-lagu penting masih tiada daripadanya. Nah, jika itu sudah rumit, bayangkan bagaimana rasanya menyimpan spektrogram semua lagu itu. Adalah perkara biasa bahawa sebahagian daripada kerja pasukan Shazam dan aplikasi lain yang serupa adalah untuk mendedikasikan dirinya untuk mengembangkan pangkalan data yang, sebenarnya, adalah nadi aplikasi.

Operasi luar taliannya sangat mudah

Kadangkala kita mungkin tertanya-tanya bagaimana aplikasi ini boleh berfungsi di luar talian, tanpa sambungan Internet. Ia sebenarnya sangat mudah, kerana mereka tidak pernah memberi kami data sehingga mereka disambungkan ke Internet. Mereka tidak perlu menyimpan keseluruhan lagu, malah tidak perlu menyimpan muzik yang ingin kami analisis. Pada hakikatnya, satu-satunya perkara yang mereka simpan ialah data spektrografi, supaya kemudiannya mereka boleh dibandingkan dalam pangkalan data, dan itu tidak mengambil apa-apa.

Algoritma adalah penting

Walau bagaimanapun, satu lagi aspek terpenting aplikasi ini ialah algoritma yang mereka gunakan untuk membandingkan lagu. Algoritma, pada hakikatnya, tidak lebih daripada cara melaksanakan prosedur. Algoritma Shazam mesti sentiasa bertambah baik. kenapa? Kerana mereka mesti berusaha untuk mendapatkan sistem mengikut laluan yang membolehkannya mencari lagu dengan lebih pantas. Dan ia adalah bahawa seseorang boleh berfikir bahawa apabila spektrogram difahami dan pangkalan data lagu-lagu selesai, segala-galanya telah selesai, tetapi tidak ada yang lebih jauh dari kebenaran. Mari kita fikirkan bahawa anda harus membandingkan spektrogram dengan berjuta-juta dan berjuta-juta lagu. Walau bagaimanapun, algoritma adalah salah satu aspek utama. Terdapat beberapa teknik komputer untuk menambah baik ini, dan kami tidak akan bercakap tentang apa-apa khususnya kerana ia adalah seperti bercakap tentang bentuk Awan pada hari yang ribut. Walau bagaimanapun, adalah baik untuk mengetahui bahawa algoritma aplikasi adalah salah satu elemen penting, bersama-sama dengan fungsi spektrografi, dan pangkalan data lagu.


  1.   Elklinico kata

    Chazam mengarut. Ia adalah Soundhound atau track ID yang lebih baik daripada Sony.


  2.   The beattle kata

    Menarik…