كيف تعمل التطبيقات التي تتعرف على الأغاني ، مثل Shazam؟

مخطط الطيف

أصبح تطبيق Shazam وشركته أحد أكثر التطبيقات المدهشة التي يمكننا حملها على هاتف ذكي. وليس الأمر أنهم ليسوا مشهورين ، لأن الجميع يعرفهم بالفعل ، ولكن يبدو أنه من السحر تقريبًا أنهم قادرون على التعرف على الأغنية التي يتم تشغيلها في أي لحظة. دعونا نرى كيف تعمل تطبيقات مثل Shazam بالفعل.

علم الطيف ، الركيزة الأساسية

في الواقع ، تستند هذه التطبيقات إلى ما نعرفه بالطيف ، أو التحليل الطيفي ، أي مجموعة المعرفة المتعلقة بالتحليل الطيفي. وبهذه الكلمات قد يكون من الصعب فهمها ولكننا سنشرحها بعد قليل. عندما يتم إنتاج أي صوت ، يمكننا سماعه لأن الجسيمات الموجودة بيننا وبين مصدر هذا الصوت تتحرك وتتذبذب. عندما نقول أن هذه الجسيمات تتحرك ، فإننا نعني أنها تولد موجات تنتقل من مكان إلى آخر. يُطلق على عدد المرات التي تتحرك فيها هذه الجسيمات ذهابًا وإيابًا التردد ، وبالتأكيد سمعنا جميعًا عن تردد الصوت ، أليس كذلك؟ حسنًا ، الطيف ، في هذه الحالة ، مخصص لقياس تردد الأصوات في فترة زمنية معينة. لكل صوت تردد مختلف في كل لحظة ، وهذا يسمح لنا بالتمييز ، على مخطط طيفي ، عن الأصوات التي تصدر.

كل شيء عن المقارنة

كيف تعرف الاغنية التي يتم تشغيلها؟ المقارنة. في الواقع ، يشبه ذلك أخذ "أشعة سينية" ومقارنتها بأشعة سينية أخرى للأصوات التي قمنا بتخزينها بالفعل ، وبالتالي نكون قادرين على معرفة أي منها يطابق ذلك. حسنًا ، هذه هي بالضبط طريقة عمل تطبيق Shazam والتطبيقات الأخرى.

مخطط الطيف

شزام هو مطياف

عندما نبدأ Shazam ، ويخبرنا أنه يتعرف على الأغنية ، فإن ما يفعله في الواقع هو تحويل هاتفنا الذكي إلى مطياف. إنه يلتقط الصوت ويولد مخططًا طيفيًا مثل الذي لديك فوق هذه الفقرة. بمجرد أن يكون لديك مخطط طيفي مفصل بشكل كافٍ ، يمكنك حينئذٍ مقارنته بقاعدة البيانات الكاملة التي قاموا بتخزينها.

قاعدة البيانات هي الأكثر تعقيدًا

في الواقع ، أكثرها تعقيدًا هي قاعدة البيانات التي تخزن مخططات الطيف لجميع الأغاني. نحن نعلم مدى صعوبة إنشاء خدمة موسيقية تحتوي على كل الموسيقى الموجودة في العالم. Spotify هو أحد تلك البرامج ، لكن الأغاني المهمة لا تزال مفقودة منه. حسنًا ، إذا كان هذا معقدًا بالفعل ، فتخيل كيف يجب أن يكون عليه تخزين مخططات الطيف لكل تلك الأغاني. من الطبيعي أن يكون جزء من عمل فريق Shazam والتطبيقات المماثلة الأخرى هو تكريس نفسه لتوسيع قاعدة البيانات التي ، في الواقع ، هي قلب التطبيق.

عمليتها في وضع عدم الاتصال بسيطة للغاية

قد نتساءل في بعض الأحيان عن كيفية عمل هذه التطبيقات دون اتصال بالإنترنت ، بدون اتصال بالإنترنت. إنه في الواقع بسيط للغاية ، نظرًا لأنهم لا يقدمون لنا البيانات أبدًا حتى يتم توصيلهم بالإنترنت. لا يتعين عليهم حفظ الأغنية بأكملها ، ولا يتعين عليهم حتى حفظ القطعة الموسيقية التي نريد تحليلها. في الواقع ، الشيء الوحيد الذي يحتفظون به هو البيانات الطيفية ، بحيث يمكن مقارنتها لاحقًا في قاعدة البيانات ، وهذا لا يتطلب شيئًا عمليًا.

الخوارزمية ضرورية

ومع ذلك ، فإن أحد أهم جوانب هذه التطبيقات هو الخوارزمية التي يستخدمونها لمقارنة الأغاني. الخوارزمية ، في الواقع ، ليست أكثر من طريقة لتنفيذ إجراء. يجب أن تتحسن خوارزمية Shazam باستمرار. لماذا ا؟ لأنه يجب عليهم العمل لجعل النظام يتبع مسارًا يسمح له بالعثور على الأغنية بشكل أسرع. ويمكن للمرء أن يعتقد أنه بمجرد فهم مخططات الطيف واكتمال قاعدة بيانات الأغاني ، يتم كل شيء ، لكن لا شيء أبعد عن الحقيقة. لنفكر أنه يجب عليك مقارنة مخطط الطيف بملايين وملايين الأغاني. ومع ذلك ، فإن الخوارزمية هي أحد الجوانب الرئيسية. هناك العديد من تقنيات الكمبيوتر لتحسين ذلك ، ولن نتحدث عن أي منها على وجه الخصوص لأنه سيكون مثل الحديث عن شكل السحب في يوم عاصف. ومع ذلك ، من الجيد دائمًا معرفة أن خوارزمية التطبيق هي أحد العناصر الأساسية ، إلى جانب وظيفة الطيف ، ووظيفة قاعدة بيانات الأغاني.


  1.   العيادة قال

    تمتص Chazam. إنه أفضل بكثير Soundhound أو معرف المسار من Sony.


  2.   البيتل قال

    مثير للإعجاب…