Для тех, кто не знаком с программой Verizon SongID, это бесплатное приложение, которое можно загрузить через сеть Verizon VCast. Он слушает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные какому-то всезнающему алгоритмическому зверю, который пережевывает их и возвращает вам все теги ID3 (исполнитель, альбом, песня и т. д.).
Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?
Я полагаю, что он должен взять звуковой файл (какого формата?), разобрать его (как? с помощью чего?) на какие-то ключевые идентификаторы (что это? обычные атрибуты волновых функций? фаза/сдвиг/амплитуда/и т.д.) и проверить его. против базы данных.
Все, что я нахожу в Интернете о том, как это работает, является чем-то общим, как то, что я набрал выше.
Эта услуга основана на сложном алгоритме распознавания аудио, сочетающем в себе передовую технологию распознавания аудио и большую базу данных песен. Когда вы загружаете аудиофайл, он анализируется звуковым движком. В ходе анализа его звуковой «отпечаток» извлекается и идентифицируется путем сравнения его с музыкальной базой данных. По завершении этого процесса распознавания на экране отображается информация о песнях с вероятностью их совпадения.