Як програми, які розпізнають пісні, як-от Shazam?

Спектрограма

Shazam і компанія стали одними з тих найдивовижніших додатків, які ми можемо носити на смартфоні. І справа не в тому, що вони не відомі, тому що їх усі вже знають, але здається майже чарівним, що вони здатні розпізнати, яка пісня грає в будь-який момент. Давайте подивимося, як насправді працюють такі програми, як Shazam.

Спектрографія, основний стовп

Насправді ці програми засновані на тому, що ми знаємо як спектрографія або спектроскопія, тобто сукупність знань, пов’язаних із спектроскопічним аналізом. І з цими словами це може бути важко зрозуміти, але ми пояснимо це за мить. Коли виробляється будь-який звук, ми можемо його почути, тому що частинки, які знаходяться між нами та джерелом цього звуку, рухаються, вібрують. Коли ми говоримо, що ці частинки рухаються, ми маємо на увазі, що вони породжують хвилі, які переходять з одного місця в інше. Кількість рухів цих частинок вперед-назад називається частотою, і, напевно, ми всі чули про частоту звуку, чи не так? Ну а спектрографія, в даному випадку, присвячена вимірюванню частоти звуків за певний проміжок часу. Кожен звук має різну частоту в кожен момент, і це дозволяє нам на спектрограмі розрізняти, які звуки звучать.

Це все питання порівняння

Звідки ти знаєш, яка пісня грає? Порівнюючи. Насправді, це все одно, що зробити «рентгенівський знімок» і порівняти його з іншими рентгенівськими знімками звуків, які ми вже зберегли, щоб таким чином дізнатися, який із усіх відповідає цьому. Саме так працюють Shazam та інші програми.

Спектрограма

Shazam - це спектрограф

Коли ми запускаємо Shazam, і він повідомляє нам, що він розпізнає пісню, насправді він перетворює наш смартфон на спектрограф. Він фіксує звук і створює спектрограму, подібну до тієї, яку ви маєте трохи вище цього абзацу. Коли у вас є достатньо детальний спектрограф, ви продовжуєте порівнювати його з усією базою даних, яку вони зберегли.

База даних є найскладнішою

Власне, найскладнішою з усіх є база даних, яка зберігає спектрограми всіх пісень. Ми знаємо, як важко створити музичний сервіс, який містить всю музику світу. Spotify — одна з таких програм, але в ній все ще немає важливих пісень. Ну, якщо це вже складно, уявіть собі, як зберігати спектрограми всіх цих пісень. Це нормально, що частина роботи команди Shazam та інших подібних програм полягає в тому, щоб присвятити себе розширенню бази даних, яка, по суті, є серцем програми.

Його робота в автономному режимі дуже проста

Іноді ми можемо задатися питанням, як ці програми можуть працювати в автономному режимі без підключення до Інтернету. Насправді це дуже просто, оскільки вони ніколи не передають нам дані, поки не підключені до Інтернету. Їм не потрібно зберігати всю пісню, їм навіть не потрібно зберігати музичний твір, який ми хочемо проаналізувати. Насправді, єдине, що вони зберігають, це спектрографічні дані, щоб потім їх можна було порівняти в базі даних, а це практично нічого не займає.

Алгоритм важливий

Однак ще одним із найважливіших аспектів цих програм є алгоритм, який вони використовують для порівняння пісень. Алгоритм, насправді, є не що інше, як спосіб виконання процедури. Алгоритм Shazam повинен постійно вдосконалюватися. Чому? Тому що вони повинні працювати, щоб система пішла по шляху, який дозволяє їй знаходити пісню ще швидше. І це те, що можна думати, що коли спектрограми зрозумілі і база пісень заповнена, все зроблено, але ніщо не може бути далі від істини. Давайте подумаємо, що вам слід порівняти спектрограму з мільйонами і мільйонами пісень. Однак алгоритм є одним з головних аспектів. Існує кілька комп’ютерних методів для покращення цього, і ми не будемо говорити про жодну, тому що це було б як говорити про форму Хмар у штормовий день. Проте завжди добре знати, що алгоритм програми є одним із суттєвих елементів, поряд із функцією спектрографії та бази даних пісень.


  1.   Елклініко - сказав він

    Chazam відстой. Це дуже-дуже краще Soundhound або track ID від Sony.


  2.   Бітл - сказав він

    Цікаво ...