Как работает Шазам?

Published: 25 April 2020
on channel: Ринат Юмасултанов
1,653
69

В данном видео рассказывает о том как работает Шазам (Shazam) и как этот алгоритм можно реализовать с помощью Pyhton.
В видео описывается
основной алгоритм распознавания музыкальных композиций, при этом используются
-- Дискретное преобразование Фурье (ДПФ) и в частности Быстрое преобразование Фурье (БПФ)
-- Спектрограмма
-- Проблемы поиска пиков
-- Ключевая идея Шазам (сравнение по группе пиков)
-- Генерация адресов (хэшей)

Ролик будет полезен все тем, кому интересно узнать каким образом работает один из самых популярных сайтов по поиску музыкальных фрагментов. Очень важно, что очень приличный результат в распознавании достигается в целом за счет простого алгоритма, и это показывает что зачастую не нужно усложнять модели распознавания, если вы хорошо знаете "физику" процесса

p.s. Получил жалобу за использование песни в качестве примера, поэтому пришлось вырезать звук, так что теперь только поверить на слово что именно эта песня и звучала.

Код доступен тут: https://github.com/rinum4/Ok-Shazam