Как приложения, распознающие песни, такие как Shazam?

Спектрограмма

Shazam и компания стали одними из самых удивительных приложений, которые мы можем носить на смартфоне. И дело не в том, что они не известны, потому что все их уже знают, но все же кажется почти волшебным, что они могут распознать, какая песня играет в любой момент. Давайте посмотрим, как на самом деле работают такие приложения, как Shazam.

Спектрография - важнейший столп

В действительности эти приложения основаны на том, что мы знаем как спектрография или спектроскопия, то есть совокупность знаний, связанных со спектроскопическим анализом. И эти слова могут быть трудными для понимания, но мы объясним это через мгновение. Когда издается какой-либо звук, мы можем его услышать, потому что частицы, находящиеся между нами и источником этого звука, движутся, вибрируют. Когда мы говорим, что эти частицы движутся, мы имеем в виду, что они генерируют волны, которые переходят из одного места в другое. Количество движений этих частиц вперед и назад называется частотой, и, конечно же, все мы слышали о частоте звука, верно? Итак, спектрография в данном случае предназначена для измерения частоты звуков в определенный период времени. Каждый звук имеет разную частоту в каждый момент, что позволяет нам различать на спектрограмме, какие звуки звучат.

Все дело в сравнении

Как узнать, какая песня играет? Сравнение. Фактически, это похоже на то, как если бы мы взяли «рентгеновский снимок» и сравнили его с другими рентгеновскими снимками звуков, которые мы уже сохранили, таким образом, мы можем узнать, какой из всех совпадает с этим. Именно так работают Shazam и другие приложения.

Спектрограмма

Shazam - это спектрограф

Когда мы запускаем Shazam, и он сообщает нам, что распознает песню, на самом деле он превращает наш смартфон в спектрограф. Он улавливает звук и генерирует спектрограмму, подобную той, что у вас чуть выше этого абзаца. Как только у вас будет достаточно подробный спектрограф, вы продолжите сравнивать его со всей базой данных, которую они сохранили.

База данных самая сложная

На самом деле, самая сложная из всех - это база данных, в которой хранятся спектрограммы всех песен. Мы знаем, как сложно создать музыкальный сервис, содержащий всю музыку мира. Spotify - одна из таких программ, но в ней по-прежнему отсутствуют важные песни. Что ж, если это уже сложно, представьте, каково это должно быть хранение спектрограмм всех этих песен. Это нормально, что часть работы команды Shazam и других подобных приложений заключается в расширении базы данных, которая, по сути, является сердцем приложения.

Его автономная работа очень проста

Иногда мы можем задаться вопросом, как эти приложения могут работать в автономном режиме, без подключения к Интернету. На самом деле это очень просто, поскольку они никогда не передают нам данные, пока не будут подключены к Интернету. Им не нужно сохранять всю песню, им даже не нужно сохранять музыкальное произведение, которое мы хотим проанализировать. На самом деле единственное, что они хранят, - это спектрографические данные, чтобы потом их можно было сравнить в базе данных, а это практически ничего не занимает.

Алгоритм важен

Однако еще одним из наиболее важных аспектов этих приложений является алгоритм, который они используют для сравнения песен. В действительности алгоритм - это не что иное, как способ выполнения процедуры. Алгоритм Shazam должен постоянно улучшаться. Почему? Потому что они должны работать, чтобы заставить систему следовать по пути, который позволяет ей находить песню еще быстрее. И это то, что можно подумать, что как только спектрограммы поняты и база данных песен заполнена, все готово, но ничто не может быть дальше от истины. Давайте подумаем, что вам следует сравнить спектрограмму с миллионами и миллионами песен. Однако алгоритм - это один из главных аспектов. Есть несколько компьютерных методов для улучшения этого, и мы не будем говорить ни о чем конкретно, потому что это все равно что говорить о форме Облаков в ненастный день. Однако всегда полезно знать, что алгоритм приложения является одним из важных элементов, наряду с функцией спектрографии и базой данных песен.


  1.   Эльклинико сказал

    Чазам отстой. Это оооочень лучше Soundhound или Track ID от Sony.


  2.   Битл сказал

    Интересно…