शाज़म जैसे गानों को पहचानने वाले ऐप्स कैसे होते हैं?

spectrogram

शाज़म एंड कंपनी उन सबसे आश्चर्यजनक अनुप्रयोगों में से एक बन गए हैं जिन्हें हम स्मार्टफोन पर ले जा सकते हैं। और ऐसा नहीं है कि वे प्रसिद्ध नहीं हैं, क्योंकि हर कोई उन्हें पहले से ही जानता है, लेकिन यह अभी भी लगभग जादू की तरह लगता है कि वे यह पहचानने में सक्षम हैं कि किसी भी क्षण कौन सा गाना बज रहा है। आइए देखें कि शाज़म जैसे ऐप वास्तव में कैसे काम करते हैं।

स्पेक्ट्रोग्राफी, आवश्यक स्तंभ

वास्तव में, ये अनुप्रयोग उस पर आधारित होते हैं जिसे हम स्पेक्ट्रोग्राफी, या स्पेक्ट्रोस्कोपी के रूप में जानते हैं, अर्थात स्पेक्ट्रोस्कोपिक विश्लेषण से संबंधित ज्ञान का शरीर। और इन शब्दों से इसे समझना मुश्किल हो सकता है लेकिन हम इसे एक पल में समझा देंगे। जब कोई ध्वनि उत्पन्न होती है, तो हम उसे सुन सकते हैं क्योंकि हमारे और उस ध्वनि के स्रोत के बीच के कण कंपन करते हैं। जब हम कहते हैं कि ये कण गति करते हैं, तो हमारा मतलब है कि वे तरंगें उत्पन्न करते हैं, जो एक स्थान से दूसरे स्थान पर जाती हैं। जितनी बार ये कण आगे-पीछे होते हैं, उसे आवृत्ति कहा जाता है, और निश्चित रूप से हम सभी ने ध्वनि की आवृत्ति के बारे में सुना है, है ना? खैर, स्पेक्ट्रोग्राफी, इस मामले में, एक निश्चित अवधि में ध्वनियों की आवृत्ति को मापने के लिए समर्पित है। प्रत्येक ध्वनि की प्रत्येक क्षण में एक अलग आवृत्ति होती है, और यह हमें एक स्पेक्ट्रोग्राम पर अंतर करने की अनुमति देती है, जो ध्वनियाँ बज रही हैं।

यह सब तुलना करने के बारे में है

आप कैसे जानते हैं कि कौन सा गाना बज रहा है? तुलना करना। वास्तव में, यह एक "एक्स-रे" लेने और अन्य एक्स-रे ध्वनियों के साथ तुलना करने जैसा है, जिसे हमने पहले ही सहेज लिया है, इस प्रकार यह जानने में सक्षम है कि सभी में से कौन सा मेल खाता है। ठीक इसी तरह शाज़म और अन्य ऐप काम करते हैं।

spectrogram

शाज़म एक स्पेक्ट्रोग्राफ है

जब हम शाज़म शुरू करते हैं, और यह हमें बताता है कि यह गीत को पहचान रहा है, तो यह वास्तव में हमारे स्मार्टफोन को स्पेक्ट्रोग्राफ में बदल रहा है। यह ध्वनि को कैप्चर कर रहा है और एक स्पेक्ट्रोग्राम उत्पन्न कर रहा है जैसे आपके पास इस पैराग्राफ के ठीक ऊपर है। एक बार जब आपके पास पर्याप्त रूप से विस्तृत स्पेक्ट्रोग्राफ हो जाता है, तो आप इसकी तुलना उनके द्वारा संग्रहीत पूरे डेटाबेस से करते हैं।

डेटाबेस सबसे जटिल है

हकीकत में, सबसे जटिल डेटाबेस है जो सभी गानों के स्पेक्ट्रोग्राम को स्टोर करता है। हम जानते हैं कि ऐसी संगीत सेवा बनाना कितना मुश्किल है जिसमें दुनिया का सारा संगीत हो। Spotify उन कार्यक्रमों में से एक है, लेकिन महत्वपूर्ण गाने अभी भी इससे गायब हैं। ठीक है, अगर यह पहले से ही जटिल है, तो कल्पना करें कि उन सभी गानों के स्पेक्ट्रोग्राम को स्टोर करना कैसा होगा। यह सामान्य है कि शाज़म और इसी तरह के अन्य अनुप्रयोगों की टीम के काम का हिस्सा डेटाबेस का विस्तार करने के लिए समर्पित है, जो वास्तव में, आवेदन का दिल है।

इसका ऑफ़लाइन संचालन बहुत सरल है

कभी-कभी हमें आश्चर्य हो सकता है कि ये एप्लिकेशन बिना इंटरनेट कनेक्शन के ऑफ़लाइन कैसे काम कर सकते हैं। यह वास्तव में बहुत आसान है, क्योंकि वे हमें डेटा तब तक नहीं देते जब तक वे इंटरनेट से कनेक्ट नहीं हो जाते। उन्हें पूरे गीत को सहेजना नहीं है, उन्हें उस संगीत के टुकड़े को भी सहेजना नहीं है जिसका हम विश्लेषण करना चाहते हैं। वास्तव में, केवल एक चीज जो वे रखते हैं, वह है स्पेक्ट्रोग्राफिक डेटा, ताकि बाद में डेटाबेस में उनकी तुलना की जा सके, और यह व्यावहारिक रूप से कुछ भी नहीं लेता है।

एल्गोरिथ्म आवश्यक है

हालांकि, इन अनुप्रयोगों के सबसे महत्वपूर्ण पहलुओं में से एक एल्गोरिथम है जिसका उपयोग वे गीतों की तुलना करने के लिए करते हैं। एक एल्गोरिथ्म, वास्तव में, एक प्रक्रिया को करने के एक तरीके से ज्यादा कुछ नहीं है। शाज़म के एल्गोरिथ्म में लगातार सुधार होना चाहिए। क्यों? क्योंकि उन्हें सिस्टम को उस रास्ते पर चलने के लिए काम करना चाहिए जो उसे गाने को और भी तेजी से खोजने की अनुमति देता है। और यह है कि कोई यह सोच सकता है कि एक बार स्पेक्ट्रोग्राम को समझ लिया गया और गीत डेटाबेस पूरा हो गया, तो सब कुछ हो गया, लेकिन सच्चाई से आगे कुछ भी नहीं है। मान लें कि आपको स्पेक्ट्रोग्राम की तुलना लाखों-करोड़ों गानों से करनी है। हालांकि, एल्गोरिथ्म मुख्य पहलुओं में से एक है। इसे सुधारने के लिए कई कंप्यूटर तकनीकें हैं, और हम किसी के बारे में विशेष रूप से बात नहीं करने जा रहे हैं क्योंकि यह एक तूफानी दिन बादलों के आकार के बारे में बात करने जैसा होगा। हालांकि, यह जानना हमेशा अच्छा होता है कि एप्लिकेशन का एल्गोरिदम आवश्यक तत्वों में से एक है, स्पेक्ट्रोग्राफी फ़ंक्शन और गीत डेटाबेस के साथ।


  1.   एलक्लिनिको कहा

    चाज़म बेकार है। यह सोनी की ओर से बहुत बेहतर साउंडहाउंड या ट्रैक आईडी है।


  2.   लड़ाई कहा

    दिलचस्प है ...