Shazam gibi şarkıları tanıyan uygulamalar nasıl çalışır?

Spektrogram

Shazam ve şirket, bir akıllı telefonda taşıyabileceğimiz en harika uygulamalardan biri haline geldi. Ünlü olmadıkları için de değil, çünkü herkes onları zaten tanıyor, ama yine de herhangi bir anda hangi şarkının çaldığını fark edebilmeleri neredeyse sihirli görünüyor. Shazam gibi uygulamaların gerçekte nasıl çalıştığını görelim.

Spektrografi, temel direk

Gerçekte, bu uygulamalar spektrografi veya spektroskopi olarak bildiğimiz şeye, yani spektroskopik analizle ilgili bilgi gövdesine dayanmaktadır. Ve bu kelimelerle anlamak zor olabilir ama birazdan açıklayacağız. Herhangi bir ses üretildiğinde onu duyabiliriz çünkü o sesin kaynağı ile aramızdaki parçacıklar hareket eder, titreşir. Bu parçacıkların hareket ettiğini söylediğimizde, bir yerden diğerine giden dalgalar ürettiklerini kastediyoruz. Bu parçacıkların ileri geri hareket etme sayısına frekans denir ve elbette hepimiz bir sesin frekansını duymuşuzdur, değil mi? Bu durumda spektrografi, belirli bir zaman diliminde seslerin frekansını ölçmeye adanmıştır. Her sesin her an farklı bir frekansı vardır ve bu, hangi seslerin duyulduğunu bir spektrogram üzerinde ayırt etmemizi sağlar.

Her şey bir karşılaştırma meselesi

Hangi şarkının çaldığını nereden biliyorsun? Karşılaştırma. Aslında bu, bir "Röntgen" alıp daha önce kaydettiğimiz seslerin diğer X-ışınları ile karşılaştırmak, böylece hangisinin onunla eşleştiğini bilmek gibidir. İşte Shazam ve diğer uygulamalar tam olarak böyle çalışır.

Spektrogram

Shazam bir spektrograftır

Shazam'ı başlattığımızda ve bize şarkıyı tanıdığını söylediğinde, aslında yaptığı şey akıllı telefonumuzu bir spektrografa dönüştürmektir. Sesi yakalıyor ve bu paragrafın hemen üstünde sahip olduğunuza benzer bir spektrogram oluşturuyor. Yeterince ayrıntılı bir spektrografınız olduğunda, onu depoladıkları tüm veritabanıyla karşılaştırmaya devam edersiniz.

Veritabanı en karmaşık olanıdır.

Aslında en karmaşık olanı, tüm şarkıların spektrogramlarını saklayan veritabanıdır. Dünyadaki tüm müzikleri içinde barındıran bir müzik servisi yaratmanın ne kadar zor olduğunu biliyoruz. Spotify bu programlardan biri, ancak önemli şarkılar hala eksik. Bu zaten karmaşıksa, tüm bu şarkıların spektrogramlarını saklamanın nasıl bir şey olduğunu hayal edin. Shazam ve diğer benzer uygulamalardan oluşan ekibin çalışmalarının bir kısmının, aslında uygulamanın kalbi olan veritabanını genişletmeye kendini adaması normaldir.

Çevrimdışı çalışması çok basittir

Bazen bu uygulamaların İnternet bağlantısı olmadan nasıl çevrimdışı çalışabileceğini merak edebiliriz. Aslında çok basit, çünkü internete bağlanana kadar bize asla veri vermiyorlar. Şarkının tamamını kaydetmeleri gerekmiyor, analiz etmek istediğimiz müzik parçasını kaydetmeleri bile gerekmiyor. Gerçekte, tuttukları tek şey spektrografik verilerdir, böylece daha sonra veritabanında karşılaştırılabilirler ve bu neredeyse hiçbir şey almaz.

Algoritma önemlidir

Ancak bu uygulamaların en önemli yönlerinden bir diğeri, şarkıları karşılaştırmak için kullandıkları algoritmadır. Gerçekte bir algoritma, bir prosedürü gerçekleştirmenin bir yolundan başka bir şey değildir. Shazam'ın algoritması sürekli gelişiyor olmalı. Niye ya? Çünkü sistemin şarkıyı daha da hızlı bulmasını sağlayacak bir yol izlemesi için çalışmalılar. Ve spektrogramlar anlaşıldığında ve şarkı veritabanı tamamlandığında her şeyin yapıldığını, ancak hiçbir şeyin gerçeklerden daha uzak olmadığını düşünebiliriz. Spektrogramı milyonlarca şarkıyla karşılaştırmanız gerektiğini düşünelim. Bununla birlikte, algoritma ana yönlerden biridir. Bunu geliştirmek için birkaç bilgisayar tekniği var ve özellikle herhangi birinden bahsetmeyeceğiz çünkü bu, fırtınalı bir günde Bulutların şeklinden bahsetmek gibi olacaktır. Bununla birlikte, uygulamanın algoritmasının, spektrografi işlevi ve şarkı veritabanınınki ile birlikte temel unsurlardan biri olduğunu bilmek her zaman iyidir.


  1.   klinik dijo

    Chazam berbat. Sony'den sooooo çok daha iyi Soundhound veya parça kimliği.


  2.   dövüş dijo

    İlginç…