Bagaimana cara kerja aplikasi yang mengenali lagu, seperti Shazam?

Spektogram

Shazam dan perusahaan telah menjadi salah satu aplikasi paling menakjubkan yang dapat kita bawa di smartphone. Dan bukannya mereka tidak terkenal, karena semua orang sudah mengenal mereka, tetapi tampaknya masih ajaib bahwa mereka dapat mengenali lagu mana yang sedang diputar pada saat tertentu. Mari kita lihat bagaimana aplikasi seperti Shazam sebenarnya bekerja.

Spektrografi, pilar penting

Pada kenyataannya, aplikasi ini didasarkan pada apa yang kita kenal sebagai spektrografi, atau spektroskopi, yaitu kumpulan pengetahuan yang terkait dengan analisis spektroskopi. Dan dengan kata-kata ini mungkin sulit untuk dipahami tetapi kami akan menjelaskannya sebentar lagi. Ketika suara apapun dihasilkan, kita dapat mendengarnya karena partikel yang berada di antara kita dan sumber suara itu bergerak, bergetar. Ketika kami mengatakan bahwa partikel-partikel ini bergerak, yang kami maksud adalah bahwa mereka menghasilkan gelombang, yang berpindah dari satu tempat ke tempat lain. Berapa kali partikel-partikel ini bergerak maju mundur disebut frekuensi, dan tentunya kita semua pernah mendengar tentang frekuensi suara, bukan? Nah, spektrografi dalam hal ini didedikasikan untuk mengukur frekuensi suara dalam jangka waktu tertentu. Setiap suara memiliki frekuensi yang berbeda pada setiap saat, dan itu memungkinkan kita untuk membedakan, pada spektogram, suara mana yang terdengar.

Ini semua masalah membandingkan

Bagaimana Anda tahu lagu apa yang sedang diputar? Perbandingan. Sebenarnya, ini seperti mengambil "sinar-X" dan membandingkannya dengan sinar-X lain dari suara yang telah kita simpan, sehingga dapat mengetahui mana dari semua yang cocok dengan itu. Begitulah cara kerja Shazam dan aplikasi lainnya.

Spektogram

Shazam adalah spektrograf

Ketika kami memulai Shazam, dan itu memberi tahu kami bahwa itu mengenali lagu, apa yang sebenarnya dilakukannya adalah mengubah ponsel cerdas kami menjadi spektrograf. Ini menangkap suara dan menghasilkan spektogram seperti yang Anda miliki tepat di atas paragraf ini. Setelah Anda memiliki spektrograf yang cukup detail, Anda dapat membandingkannya dengan seluruh database yang telah mereka simpan.

Basis data adalah yang paling kompleks

Sebenarnya, yang paling kompleks dari semuanya adalah database yang menyimpan spektogram dari semua lagu. Kami tahu betapa sulitnya membuat layanan musik yang berisi semua musik di dunia. Spotify adalah salah satu program itu, tetapi lagu-lagu penting masih hilang darinya. Nah, kalau itu sudah rumit, bayangkan bagaimana rasanya menyimpan spektogram dari semua lagu itu. Adalah normal bahwa bagian dari pekerjaan tim Shazam dan aplikasi serupa lainnya adalah untuk mendedikasikan dirinya untuk memperluas basis data yang, pada kenyataannya, adalah jantung dari aplikasi.

Operasi offline-nya sangat sederhana

Terkadang kita mungkin bertanya-tanya bagaimana aplikasi ini dapat bekerja secara offline, tanpa koneksi internet. Sebenarnya sangat sederhana, karena mereka tidak pernah memberi kita data sampai mereka terhubung ke Internet. Mereka tidak harus menyimpan seluruh lagu, mereka bahkan tidak perlu menyimpan bagian musik yang ingin kita analisis. Pada kenyataannya, satu-satunya yang mereka simpan adalah data spektrografi, sehingga nantinya dapat dibandingkan dalam database, dan praktis tidak memakan apa pun.

Algoritma itu penting

Namun, aspek terpenting lainnya dari aplikasi ini adalah algoritme yang mereka gunakan untuk membandingkan lagu. Algoritma, pada kenyataannya, tidak lebih dari cara melakukan prosedur. Algoritma Shazam harus terus ditingkatkan. Mengapa? Karena mereka harus bekerja agar sistem mengikuti jalur yang memungkinkannya menemukan lagu lebih cepat. Dan orang dapat berpikir bahwa setelah spektogram dipahami dan database lagu selesai, semuanya selesai, tetapi tidak ada yang lebih jauh dari kebenaran. Mari kita berpikir bahwa Anda harus membandingkan spektogram dengan jutaan dan jutaan lagu. Namun, algoritma adalah salah satu aspek utama. Ada beberapa teknik komputer untuk meningkatkan ini, dan kami tidak akan membicarakannya secara khusus karena itu akan seperti berbicara tentang bentuk Awan pada hari yang penuh badai. Namun, selalu baik untuk mengetahui bahwa algoritme aplikasi adalah salah satu elemen penting, bersama dengan fungsi spektrografi, dan basis data lagu.


  1.   klinik dijo

    Chazam menyebalkan. Ini adalah Soundhound atau ID trek yang jauh lebih baik dari Sony.


  2.   beattle dijo

    Menarik…