Как в яндексе найти музыку по звучанию

Распознавание треков

Если вы хотите узнать, какая мелодия играет в кафе или на улице, воспользуйтесь ботом Яндекс Музыки для Telegram.

Чтобы бот распознал трек, который вы слышите:

  1. Откройте чат с ботом в Telegram.

  2. В правом нижнем углу экрана нажмите кнопку микрофона и удерживайте ее 5–10 секунд.

  3. Отпустите кнопку.

Бот определит название трека и отправит ссылку на него в каталоге Яндекс Музыки, чтобы вы могли добавить трек в свою фонотеку.

Если бот не смог найти трек, попробуйте записать и отправить другой отрывок.

Распознавание треков

Узнайте, какой трек вы слышите:

  1. В правом верхнем углу нажмите .

  2. В нижней части экрана нажмите кнопку .

Примечание. Если вы пользуетесь этой кнопкой в первый раз, разрешите приложению доступ к микрофону устройства.

Приложение определит название и исполнителя трека и добавит трек в вашу фонотеку. Все распознанные треки вы увидите в разделе Коллекция в плейлисте Распознано.

Если приложение не определило трек, попробуйте распознать другой отрывок.

Как Яндекс распознаёт музыку с микрофона

Время на прочтение
10 мин

Количество просмотров 157K

Поиск по каталогу музыки — это задача, которую можно решать разными путями, как с точки зрения пользователя, так и технологически. Яндекс уже довольно давно научился искать и по названиям композиций, и по текстам песен. На сказанные голосом запросы про музыку мы тоже умеем отвечать в Яндекс.Поиске под iOS и Android, сегодня же речь пойдёт о поиске по аудиосигналу, а если конкретно — по записанному с микрофона фрагменту музыкального произведения. Именно такая функция встроена в мобильное приложение Яндекс.Музыки:

image

В мире есть всего несколько специализированных компаний, которые профессионально занимаются распознаванием музыкальных треков. Насколько нам известно, из поисковых компаний Яндекс стал первым, кто стал помогать российскому пользователю в решении этой задачи. Несмотря на то, что нам предстоит ещё немало сделать, качество распознавания уже сопоставимо с лидерами в этой области. К тому же поиск музыки по аудиофрагменту не самая тривиальная и освещённая в Рунете тема; надеемся, что многим будет любопытно узнать подробности.

О достигнутом уровне качества

Базовым качеством мы называем процент валидных запросов, на которые дали релевантный ответ — сейчас около 80%. Релевантный ответ — это трек, в котором содержится запрос пользователя. Валидными считаем лишь те запросы из приложения Яндекс.Музыки, которые действительно содержат музыкальную запись, а не только шум или тишину. При запросе неизвестного нам произведения считаем ответ заведомо нерелевантным.

Технически задача формулируется следующим образом: на сервер поступает десятисекундный фрагмент записанного на смартфон аудиосигнала (мы его называем запросом), после чего среди известных нам треков необходимо найти ровно тот один, из которого фрагмент был записан. Если фрагмент не содержится ни в одном известном треке, равно как и если он вообще не является музыкальной записью, нужно ответить «ничего не найдено». Отвечать наиболее похожими по звучанию треками в случае отсутствия точного совпадения не требуется.

База треков

Как и в веб-поиске, чтобы хорошо искать, нужно иметь большую базу документов (в данном случае треков), и они должны быть корректно размечены: для каждого трека необходимо знать название, исполнителя и альбом. Как вы, наверное, уже догадались, у нас была такая база. Во-первых, это огромное число записей в Яндекс.Музыке, официально предоставленных правообладателями для прослушивания. Во-вторых, мы собрали подборку музыкальных треков, выложенных в интернете. Так мы получили 6 млн треков, которыми пользователи интересуются чаще всего.

Зачем нам треки из интернета, и что мы с ними делаем

Наша цель как поисковой системы — полнота: на каждый валидный запрос мы должны давать релевантный ответ. В базе Яндекс.Музыки нет некоторых популярных исполнителей, не все правообладатели пока участвуют в этом проекте. С другой стороны, то что у нас нет права давать пользователям слушать какие-то треки с сервиса, вовсе не означает, что мы не можем их распознавать и сообщать имя исполнителя и название композиции.

Раз мы — зеркало интернета, мы собрали ID3-теги и дескрипторы каждого популярного в Сети трека, чтобы опознавать и те произведения, которых нет в базе Яндекс.Музыки. Хранить достаточно только эти метаданные — по ним мы показываем музыкальные видеоклипы, когда нашлись только записи из интернета.

Малоперспективные подходы

Как лучше сравнивать фрагмент с треками? Сразу отбросим заведомо неподходящие варианты.

  1. Побитовое сравнение. Даже если принимать сигнал напрямую с оптического выхода цифрового проигрывателя, неточности возникнут в результате перекодирования. А на протяжении передачи сигнала есть много других источников искажений: громкоговоритель источника звука, акустика помещения, неравномерная АЧХ микрофона, даже оцифровка с микрофона. Всё это делает неприменимым даже нечёткое побитовое сравнение.
  2. Водяные знаки. Если бы Яндекс сам выпускал музыку или участвовал в производственном цикле выпуска всех записей, проигрываемых на радио, в кафе и на дискотеках — можно было бы встроить в треки звуковой аналог «водяных знаков». Эти метки незаметны человеческому уху, но легко распознаются алгоритмами.
  3. Нестрогое сравнение спектрограмм. Нам нужен способ нестрогого сравнения. Посмотрим на спектрограммы оригинального трека и записанного фрагмента. Их вполне можно рассматривать как изображения, и искать среди изображений всех треков самую похожую (например, сравнивая как векторы с помощью одной из известных метрик, таких как L²):
    image
    Но в применении этого способа «в лоб» есть две сложности:
    а) сравнение с 6 млн картинок — очевидно, дорогая операция. Даже огрубление полной спектрограммы, которое в целом сохраняет свойства сигнала, даёт несколько мегабайт несжатых данных.
    б) оказывается что одни различия более показательны, чем другие.

В итоге, для каждого трека нам нужно минимальное количество наиболее характерных (т.е. кратко и точно описывающих трек) признаков.

Каким признакам не страшны искажения?

Основные проблемы возникают из-за шума и искажений на пути от источника сигнала до оцифровки с микрофона. Можно для разных треков сопоставлять оригинал с фрагментом, записанным в разных искусственно зашумлённых условиях — и по множеству примеров найти, какие характеристики лучше всего сохраняются. Оказывается, хорошо работают пики спектрограммы, выделенные тем или иным способом — например как точки локального максимума амплитуды. Высота пиков не подходит (АЧХ микрофона их меняет), а вот их местоположение на сетке «частота-время» мало меняется при зашумлении. Это наблюдение, в том или ином виде, используется во многих известных решениях — например, в Echoprint. В среднем на один трек получается порядка 300 тыс. пиков — такой объём данных гораздо более реально сопоставлять с миллионами треков в базе, чем полную спектрограмму запроса.
image

Но даже если брать только местоположения пиков, тождественность множества пиков между запросом и отрезком оригинала — плохой критерий. По большому проценту заведомо известных нам фрагментов он ничего не находит. Причина — в погрешностях при записи запроса. Шум добавляет одни пики, глушит другие; АЧХ всей среды передачи сигнала может даже смещать частоту пиков. Так мы приходим к нестрогому сравнению множества пиков.

Нам нужно найти во всей базе отрезок трека, наиболее похожий на наш запрос. То есть:

  • сначала в каждом треке найти такое смещение по времени, где бы максимальное число пиков совпало с запросом;
  • затем из всех треков выбрать тот, где совпадение оказалось наибольшим.

Для этого строим гистограмму: для каждой частоты пика, которая присутствует и в запросе, и в треке, откладываем +1 по оси Y в том смещении, где нашлось совпадение:
image
Трек с самой высоким столбцом в гистограмме и есть самый релевантный результат — а высота этого столбца является мерой близости между запросом и документом.

Борьба за точность поиска

Опыт показывает, что если искать по всем пикам равнозначно, мы будем часто находить неверные треки. Но ту же меру близости можно применять не только ко всей совокупности пиков документа, но и к любому подмножеству — например, только к наиболее воспроизводимым (устойчивым к искажениям). Заодно это и удешевит построение каждой гистограммы. Вот как мы выбираем такие пики.

Отбор по времени: сначала, внутри одной частоты, по оси времени от начала к концу записи запускаем воображаемое «опускающееся лезвие». При обнаружении каждого пика, который выше текущего положения лезвия, оно срезает «верхушку» — разницу между положением лезвия и высотой свежеобнаруженного пика. Затем лезвие поднимается на первоначальную высоту этого пика. Если же лезвие не «обнаружило» пика, оно немного опускается под собственной тяжестью.
image

Разнообразие по частотам: чтобы отдавать предпочтение наиболее разнообразным частотам, мы поднимаем лезвие не только в само́й частоте очередного пика, но и (в меньшей степени) в соседних с ней частотах.

Отбор по частотам: затем, внутри одного временно́го интервала, среди всех частот, выбираем самые контрастные пики, т.е. самые большие локальные максимумы среди срезанных «верхушек».
image
При отборе пиков есть несколько параметров: скорость опускания лезвия, число выбираемых пиков в каждом временно́м интервале и окрестность влияния пиков на соседей. И мы подобрали такую их комбинацию, при которой остаётся минимальное число пиков, но почти все они устойчивы к искажениям.

Ускорение поиска

Итак, мы нашли метрику близости, хорошо устойчивую к искажениям. Она обеспечивает хорошую точность поиска, но нужно ещё и добиться, чтобы наш поиск быстро отвечал пользователю. Для начала нужно научиться выбирать очень малое число треков-кандидатов для расчёта метрики, чтобы избежать полного перебора треков при поиске.

Повышение уникальности ключей: Можно было бы построить индекc
    Частота пика(Трек, Местоположение в нём).
Увы, такой «словарь» возможных частот слишком беден (256 «слов» — интервалов, на которые мы разбиваем весь частотный диапазон). Большинство запросов содержит такой набор «слов», который находится в большинстве из наших 6 млн документов. Нужно найти более отличительные (discriminative) ключи — которые с большой вероятностью встречаются в релевантных документах, и с малой в нерелевантных.

Для этого хорошо подходят пары близко расположенных пиков. Каждая пара встречается гораздо реже.
У этого выигрыша есть своя цена — меньшая вероятность воспроизведения в искажённом сигнале. Если для отдельных пиков она в среднем P, то для пар — P2 (т.е. заведомо меньше). Чтобы скомпенсировать это, мы включаем каждый пик сразу в несколько пар. Это немного увеличивает размер индекса, но радикально сокращает число напрасно рассмотренных документов — почти на 3 порядка:

Оценка выигрыша

Например, если включать каждый пик в 8 пар и «упаковать» каждую пару в 20 бит (тогда число уникальных значений пар возрастает до ≈1 млн), то:

  • число ключей в запросе растёт в 8 раз
  • число документов на ключ уменьшается в ≈4000 раз: ≈1 млн/256
  • итого, число напрасно рассмотренных документов уменьшается в ≈500 раз: ≈4000/8

image

Отобрав с помощью пар малое число документов, можно переходить к их ранжированию. Гистограммы можно с тем же успехом применять к парам пиков, заменив совпадение одной частоты на совпадение обеих частот в паре.

Двухэтапный поиск: для дополнительного уменьшения объёма расчётов мы разбили поиск на два этапа:

  1. Делаем предварительный отбор (pruning) треков по очень разреженному набору наиболее контрастных пиков. Параметры отбора подбираются так, чтобы максимально сузить круг документов, но сохранить в их числе наиболее релевантный результат
  2. Выбирается гарантированно наилучший ответ — для отобранных треков считается точная релевантность по более полной выборке пиков, уже по индексу с другой структурой:
        Трек(Пара частот, Местоположение в треке).

Такая двухэтапность ускорила поиск в 10 раз. Интересно, что в 80% случаев результат даже огрублённого ранжирования на первом этапе совпадает с самым релевантным ответом, полученным на втором этапе.

В результате всех описанных оптимизаций вся база, необходимая для поиска, стала в 15 раз меньше, чем сами файлы треков.

Индекс в памяти: И наконец, чтобы не ждать обращения к диску на каждый запрос, весь индекс размещён в оперативной памяти и распределён по множеству серверов, т.к. занимает единицы терабайт.

Ничего не найдено?

Случается, что для запрошенного фрагмента либо нет подходящего трека в нашей базе, либо фрагмент вообще не является записью какого-либо трека. Как принять решение, когда лучше ответить «ничего не найдено», чем показать «наименее неподходящий» трек? Отсекать по какому-нибудь порогу релевантности не удаётся — для разных фрагментов порог различается многократно, и единого значения на все случаи просто не существует. А вот если отсортировать отобранные документы по релевантности, форма кривой её значений даёт хороший критерий. Если мы знаем релевантный ответ, на кривой отчётливо видно резкое падение (перепад) релевантности, и напротив — пологая кривая подсказывает, что подходящих треков не найдено.
image

Что дальше

Как уже говорилось, мы в начале большого пути. Впереди целый ряд исследований и доработок для повышения качества поиска: например, в случаях искажения темпа и повышенного шума. Мы обязательно попробуем применить машинное обучение, чтобы использовать более разнообразный набор признаков и автоматически выбирать из них наиболее эффективные.

Кроме того, мы планируем инкрементальное распознавание, т.е. давать ответ уже по первым секундам фрагмента.

Другие задачи аудиопоиска по музыке

Область информационного поиска по музыке далеко не исчерпывается задачей с фрагментом с микрофона. Работа с «чистым», незашумлённым сигналом, претерпевшим только пережатие, позволяет находить дублирующиеся треки в обширной коллекции музыки, а также обнаруживать потенциальные нарушения авторского права. А поиск неточных совпадений и разного вида схожести — целое направление, включающее в себя поиск кавер-версий и ремиксов, извлечение музыкальных характеристик (ритм, жанр, композитор) для построения рекомендаций, а также поиск плагиата.

Отдельно выделим задачу поиска по напетому отрывку. Она, в отличие от распознавания по фрагменту музыкальной записи, требует принципиально другого подхода: вместо аудиозаписи, как правило, используется нотное представление произведения, а зачастую и запроса. Точность таких решений получается сильно хуже (как минимум, из-за несопоставимо бо́льшего разброса вариаций запроса), а поэтому хорошо они опознают лишь наиболее популярные произведения.

Что почитать

  • Avery Wang: «An Industrial-Strength Audio Search Algorithm», Proc. 2003 ISMIR International Symposium on Music Information Retrieval, Baltimore, MD, Oct. 2003. Эта статья впервые (насколько нам известно) предлагает использовать пики спектрограммы и пары пиков как признаки, устойчивые к типичным искажениям сигнала.
  • D. Ellis (2009): «Robust Landmark-Based Audio Fingerprinting». В этой работе даётся конкрентый пример реализации отбора пиков и их пар с помощью «decaying threshold» (в нашем вольном переводе — «опускающегося лезвия»).
  • Jaap Haitsma, Ton Kalker (2002): «A Highly Robust Audio Fingerprinting System». В данной статье предложено кодировать последовательные блоки аудио 32 битами, каждый бит описывает изменение энергии в своем диапазоне частот. Описанный подход легко обобщается на случай произвольного кодирования последовательности блоков аудиосигнала.
  • Nick Palmer: «Review of audio fingerprinting algorithms and looking into a multi-faceted approach to fingerprint generation». Основной интерес в данной работе представляет обзор существующих подходов к решению описанной задачи. Также описаны этапы возможной реализации.
  • Shumeet Baluja, Michele Covell: «Audio Fingerprinting: Combining Computer Vision & Data Stream Processing». Статья, написанная коллегами из Google, описывает подход на основе вейвлетов с использованием методов компьютерного зрения.
  • Arunan Ramalingam, Sridhar Krishnan: «Gaussian Mixture Modeling Using Short Time Fourier Transform Features For Audio Fingerprinting» (2005). В данной статье предлагается описывать фрагмент аудио с помощью модели Гауссовых смесей поверх различных признаков, таких как энтропия Шеннона, энтропия Реньи, спектрольные центроиды, мэлкепстральные коэффициенты и другие. Приводятся сравнительные значения качества распознавания.
  • Dalibor Mitrovic, Matthias Zeppelzauer, Christian Breiteneder: «Features for Content-Based Audio Retrieval». Обзорная работа про аудио-признаки: как их выбирать, какими свойствами они должны обладать и какие существуют.
  • Natalia Miranda, Fabiana Piccoli: «Using GPU to Speed Up the Process of Audio Identification». В статье предлагается использование GPU для ускорения вычисления сигнатур.
  • Shuhei Hamawaki, Shintaro Funasawa, Jiro Katto, Hiromi Ishizaki, Keiichiro Hoashi, Yasuhiro Takishima: «Feature Analysis and Normalization Approach for Robust Content-Based Music Retrieval to Encoded Audio with Different Bit Rates.» MMM 2009: 298-309. В статье акцентируется внимание на повышении робастности представления аудиосигнала на основе мел-кепстральных коэффициентов (MFCC). Для этого используется метод нормализации кепстра (CMN).

Управление «Станцией», импорт треков, настройка предпочтений и не только.

10 полезных функций «Яндекс.Музыки», о которых вы могли не знать

1. Распознавание музыки

«Яндекс.Музыка» вполне может заменить Shazam и быстро добавить распознанный трек в вашу библиотеку.

Как работает: в мобильном приложении откройте поиск, сверните клавиатуру и нажмите на фиолетовую кнопку для распознавания трека.

2. Таймер сна

Если вы привыкли слушать музыку перед сном, то в приложении можно настроить таймер отключения, который остановит воспроизведение через определённое время.

Как работает: откройте главный экран воспроизведения, где отображается обложка альбома, нажмите на иконку секундомера в самом низу и выберите нужное время.

3. Управление «Станцией» и другими устройствами

В конце прошлого года в «Яндекс.Музыке» наконец появилась функция управления «Станцией», которая позволяет быстро перенаправить звук на нужную колонку, отрегулировать громкость и переключать треки.

Эта же функция позволяет подключить «Яндекс.Музыку», например, к устройствам с AirPlay или к Android TV.

Как работает: на главном экране воспроизведения нажмите на кнопку с изображением монитора и колонки в правом верхнем углу, а после подключитесь к одному из обнаруженных устройств.

4. Детский раздел

Специально для самых маленьких слушателей «Яндекс.Музыка» предлагает огромное количество детских книг и плейлисты детской музыки — в том числе треки из различных мультфильмов.

Как работает: чтобы включить раздел детской музыки, в приложении откройте экран «Коллекция» (сердечко справа), нажмите на шестерёнку настроек и активируйте переключатель «Показывать раздел „Детям“».

5. Эквалайзер

В «Яндекс.Музыке» нет своего эквалайзера, но есть доступ к внешним, то есть к настройкам звука вашего смартфона. Они могут позволить настроить звучание треков под ваши предпочтения.

Как работает: откройте экран «Коллекция» (сердечко справа), нажмите на шестерёнку настроек, отмотайте вниз, нажмите «Эквалайзер» и включите его.

6. Автосохранение треков

Чтобы ваши плейлисты были доступны для прослушивания даже без подключения к Сети, их можно сохранять в память смартфона. Для этого у каждого есть кнопка «Скачать».

Однако если у вас десятки плейлистов и много свободной памяти, то проще включить автоматическое сохранение — так все песни будут скачиваться при первом же воспроизведении.

Как работает: откройте экран «Коллекция», нажмите на шестерёнку настроек и активируйте переключать напротив пункта «Автосохранение треков».

7. Ссылки на соцсети и концерты исполнителей

Если у исполнителя есть официальный сайт и группы в социальных сетях, то вы наверняка найдёте ссылки на них в «Яндекс.Музыке». Аналогично и с живыми выступлениями, анонсы которых часто отражаются в приложении.

Как работает: откройте страницу группы или артиста и отмотайте её до самого низа — сначала там могут быть анонсы концертов, а дальше — и сайт, и ссылка на «ВКонтакте», и YouTube-профиль.

8. Импорт музыки из других сервисов

Мы уже рассказывали о трёх способах переноса музыку из Spotify, однако не так давно «Яндекс» запустил официальный инструмент для быстрого переезда — и не только из Spotify, но и из Apple Music, Deezer и Last.fm.

Как работает: откройте экран «Коллекция», нажмите на шестерёнку настроек, перейдите к пункту «Импорт медиатеки», выберите сервис и следуйте инструкциям.

9. Музыкальные предпочтения

Если ваши музыкальные вкусы сильно изменились и вы не хотите получать в рекомендациях треки определённых жанров и направлений, то нужно вручную уточнить свои предпочтения. Это можно сделать через веб-версию «Яндекс.Музыки».

Как работает: откройте раздел «Коллекция», нажмите «Настройки» и выберите «Уточнить» напротив пункта «Музыкальные предпочтения».

10. Статистика прослушиваний

Также в веб-версии есть статистика популярности исполнителей. Она не только отображает количество лайков и прослушиваний, но и показывает разницу от месяца к месяцу, регионы, где больше всего слушателей, а также цифры по похожим артистам.

Как работает: откройте экран любого исполнителя и перейдите к самому крайнему разделу с названием «Инфо».

«Яндекс.Музыка» →

appbox fallback https://play.google.com/store/apps/details?id=ru.yandex.music&hl=ru&hl=ru&gl=ru

Читайте также 🧐

  • Обзор новой версии «Яндекс.Станции Мини» — громче звук и кнопки вместо жестов
  • 15 полезных функций Telegram, о которых знают не все
  • «Яндекс» представил второе поколение «Станции»

В конце 90-х существовала телепередача под названием «Угадай мелодию», где отъявленные меломаны отгадывали популярные песни по фрагменту. Получалось далеко не у всех, но порция хорошего настроения перепадала каждому, включая зрителей перед телевизором. А музыкальная грамотность среди фанатов «Угадайки» росла как на дрожжах.

Время прошло, передача давно закрылась, но наше желание узнать, как называется песня, которая играет сейчас в кафе, в такси или в кино, никуда не делось. Сегодня для этого даже не надо включать телеящик, ведь есть онлайн-сервисы для компьютера и приложения для смартфона, которые опознают любую мелодию с первых нот. О них, а также о результатах моего тестирования и пойдет речь дальше.

Содержание

  1. Shazam
  2. Midomi
  3. Яндекс.Музыка и Алиса
  4. Audio tag
  5. WatZatSong
  6. Song Finder
  7. BeatFind
  8. Shortcut for Google Sound Search

Shazam

Без преувеличения, Shazam – это самое известное приложение для распознавания музыки. С его помощью можно найти песню по звуку, нажав всего одну кнопку на смартфоне. Оно бесплатно, очень просто в применении и переведено на множество языков, в том числе русский.

Помимо основной функции, Shazam позволяет прослушать другие композиции исполнителя найденного трека, если они есть в бесплатном доступе, однако владельцам «Яблочных» девайсов придется довольствоваться фрагментами. Также здесь можно искать композиции вручную через строку поиска.

Чтобы распознать трек, нажмите на центральную кнопку с логотипом приложения и дождитесь, пока оно выдаст результат.

запуск распознавания песни в Shazam

На мой взгляд, среди всех сервисов определения музыки фонотека в Шазаме одна из самых полных. Она сохраняет все найденные пользователем композиции, удобно сортируя их по исполнителям.

библиотека исполнителей в Шазам

А вот функция «Плейлист для тебя» не всегда угадывает предпочтения. Хотя не исключено, что всё дело в моем вкусе.

Midomi

Midomi – бесплатный англоязычный интернет-сервис для ПК, который также позволяет узнать песню онлайн. Русского языка в нем нет, но это не вызывает больших проблем, если ваш браузер переводит страницы автоматически.

Чтобы определить мелодию с помощью Midomi, нажмите на логотип в центре страницы сервиса и включите проигрывание музыки.

запуск определения музыки онлайн в Midomi

Только не забывайте отключать перевод после распознавания песни, иначе вместо легендарного «Don’t cry tonight» группы Savage вы увидите просьбу не плакать сегодня вечером от кого-то дикого.

результат поиска песни в MIdomi

Мидоми исправно находит абсолютное большинство композиций, кроме, пожалуй, редких и нишевых. И я поставил бы ему высокую оценку, если б не грубое навязывание абсолютно неприемлемой для меня, аккуратно внесенной в список лучших треков найденного исполнителя.

лучшие песни в Midomi

У сервиса Midomi есть свое приложение для Андроид под названием SoundHound, которое функционально похоже на Шазам, то есть интуитивно понятно. Как и в Шазам, чтобы распознать музыку, в нем достаточно нажать всего одну кнопку. А алгоритм поиска, на мой взгляд, работает даже лучше, чем у конкурента. Так, SoundHound нашел песню чеченского барда «Моя струна» в исполнении Алисы Супруновой, с поиском которой Shazam не справился.

Для определения названия песни, которая сейчас играет, запустите приложение и нажмите на кнопку с логотипом в центре.

кнопка запуска распознавания мелодии

Помимо главной функции, SoundHound создает подборки и рекомендованные списки композиций, ориентируясь на запросы пользователя.

композиция моя струна в Midomi

Радует, что в мобильной версии Midomi, в отличие от браузерной, нет навязчивого пиара треков сомнительного качества. А есть только море популярной музыки, рассортированной по направлениям.

плейлисты Midomi

Приложение SoundHound  полностью бесплатно. Реклама присутствует здесь в виде ненавязчивой плашки, которая никак не мешает пользоваться им.

Яндекс.Музыка и Алиса

Отечественные разработчики тоже не обошли стороной тему опознавания звучащего трека. Яндекс с Алисой на борту неплохо справляется с поиском композиций, представленных в другом приложении компании — Яндекс.Музыка.

Однако назвать этот сервис удачным у меня язык не поворачивается, поскольку музыки, которая не представлена в Яндексе, для Алисы как бы не существует. Когда голосовой помощник встречается с неизвестными треками, он лишь беспомощно отшучивается.

Чтобы Алиса распознала песню во время воспроизведения, произнесите голосом в микрофон:  «Что это играет?» или «Что это за музыка?»

что это за музыка Алиса

Так, в первом случае у меня на телефоне играл кавер на «Прекрасное далеко» Юрия Энтина в исполнении группы Комплексные числа («Complex Number»), а во втором все та же «Моя струна» Алисы Супруновой. Третий раз — это повторный поиск.

Зато Алиса почти мгновенно распознала трек, который есть в Яндекс.Музыке:

распознавание трека из Яндекс Музыки

Кстати, вместо того, чтобы дать мне сразу послушать найденное, Яндекс попросил заплатить за подписку 100 рублей. Но мы пойдем другим путем, ведь Алису всегда можно попросить найти трек на Ютубе.

Audio tag

От предыдущих интернет-сервис AudioTag отличается тем, что ищет музыку не по услышанному через микрофон, а по загруженному файлу композиции или ее отрывка. Как и конкуренты, он прост, удобен и понятен, а главное — не просит ни за что оплаты и не требует регистрации.

Определить трек с помощью Аудио Тег можно двумя способами:

  1. Загрузив аудиозапись на сервис с ПК. Для этого:
  • нажмите на кнопку «Выберите файл»;
  • кликните нужный музыкальный файл на компьютере.
  1. По ссылке из Интернета. Для этого :
  • нажмите кнопку «Введите линк»;
  • скопируйте ссылку на интересующую аудио- или видеозапись и вставьте в поле.

распознавание по файлу или ссылке в Audio tag

Я «скормил» сервису запись песни группы Элизиум «Не верю», и он отлично справился с распознаванием.

результаты распознавания в AudioTag

Определить композицию, зная название и имя исполнителя – не то, чтобы великий подвиг. Поэтому следующим шагом был поиск песни «Моя струна» по ссылке на Ютубе. И хотя трек имел название и имя исполнителя в заголовке, сервис его не узнал.

результатов нет в AudioTag

После серии попыток поиска различными способами результат эксперимента показал, что Audio tag хорошо справляется с популярной музыкой и очень плохо ищет нишевые треки.

Что касается дополнительных функций, то он позволяет послушать ТОП треков, которые ищут пользователи, порыться в фонотеке и заглянуть в прошлое, чтобы узнать, какую музыку слушали в выбранном году.

WatZatSong

Как и предыдущий сервис, WatZatSong позволяет узнать, кто поет песню, которую вы загрузили на сайт в виде файла или ссылки. Но, в отличие от Audio Tag и остальных, распознаванием композиций здесь занимается не роботизированный алгоритм, а живые люди. Да и сам WatZatSong – это скорее социальная сеть для меломанов, чем сервис по поиску музыки.

Чтобы пользователи помогли вам распознать мелодию, загрузите аудиофайл на сайт, нажав вверху страницы кнопку «Post a Sample».

загрузка трека в WatZatSong

Быстрого результата здесь ожидать не стоит. Однако коллективный разум сообщества способен отыскать даже очень редкие каверы.

Интерфейс WatZatSong доступен только на английском и французском языках. С переводом его на русский с трудом справляется даже Гугл. Зато оплаты за пользование здесь никто не требует.

Song Finder

Song Finder – бесплатный распознаватель музыки для Андроид-смартфонов, который также угадывает названия мелодий в процессе проигрывания. Глядя на его интерфейс, нетрудно догадаться, что разработчики вдохновлялись Шазамом.

Работает это приложение тоже как прототип: для запуска распознавания нажмите кнопку в центре главного экрана и ждите результата.

кнопка для старта распознавания мелодии в Song Finder

Song Finder имеет чуть более скромный функционал, чем Shazam. Здесь, помимо главного, есть только история поисков и ТОП-чарты зарубежной эстрады. Но у этого приложения есть и сильная сторона – оно предлагает выбрать, с помощью какого сервиса вы хотите прослушать распознанную песню.

выбор сервиса для прослушивания песни

Наверное, это действительно удобная функция для англоязычных пользователей. Но в случае с русскими песнями выходит оказия: Song Finder отлично справился с поиском бардовской песни «Враг», больше известной как «Враг навсегда остается врагом» исполнительницы Кошка Саша. Но из-за отсутствия поддержки русского языка он перевел название песни на английский (выделено красным прямоугольником на скриншоте выше). Именно в таком виде приложение и ищет композицию в выбранном сервисе. Результат очевиден – ничего не находится.

поиск песни в приложении Вконтакте

Мое мнение: если по каким-то причинам вам не подходит Шазам, и вы ищете что-то очень на него похожее, то Song Finder – отличный вариант.

BeatFind

BeatFind – простой определитель треков по звуку для Android. Здесь нет ничего лишнего: только поиск музыки и история найденного.

Приложение полностью бесплатно, но даже для разблокировки функции смены оболочки оно заставит вас посмотреть рекламный ролик длительностью 30 сек. Зато дизайн у BeatFind завораживающий. Он работает как 3D-светомузыка во время поиска трека.

процесс поиска мелодии в BeatFind

К сожалению, скриншот не передает всей прелести этой картины, но даже так заметно, что разработчики постарались выделить свое приложение из массы похожих. На мой взгляд, оно имеет только один недостаток – интерфейс не переведен на русский язык. Впрочем, это компенсируется простотой.

Чтобы BeatFind начал распознавать трек, нажмите на иконку с изображением молнии.

Что касается качества работы приложения, то мнения пользователей, судя по отзывам, разделились на две крайних позиции – от восторга до полного разочарования.

отзывы о BeatFind

Испытания на моем плейлисте прошли без сюрпризов. Песню «Моя струна» BeatFind узнал буквально за пару секунд. И даже композицию «Враг» Кошки Саши не обозвало английскими словами, как это сделал Song Finder.

определение трека в BeatFind

А вот с поиском кавера на «Прекрасное далеко» группы Complex Number программа уже не справилась. Поэтому мой вердикт таков: как альтернатива популярным сервисам она уместна, но не более.

Shortcut for Google Sound Search

Я не зря оставил Shortcut for Google напоследок. По моему мнению, это приложение достойно занять первое место в рейтинге. Его главная «фишка» в том, что оно способно узнавать не только играющую музыку, но также мелодии и мотивы, напетые  в микрофон.

Даже несмотря на мое «выдающееся» исполнение композиции «Смутное время» группы Ария, от которого один кот захотел удушиться пакетом, а второй утопиться в унитазе, Shortcut for Google Sound Search распознал песню с вероятностью совпадения на 72%.

узнаем музыку в Shortcut for Google Sound Search

Более того, это приложение справилось с напетым мной мотивом трека Марка Халидая «Popcorn», в котором вообще нет слов. Это та самая музыка из эпизода мультфильма «Ну, погоди!» про стройку. Я просто повторил несколько раз что-то вроде «ту-ту-ту-тудуту» и программа чудным образом, выдала несколько результатов:

результаты из google поиска

Конечно, оригинала в этом списке нет, но, справедливости ради, стоит отметить, что его вообще трудно найти в интернете.

С остальными треками, на которых я тестировал все приложения и сервисы, Shortcut for Google тоже справился. Правда, он нашел какой-то другой кавер на «Прекрасное далеко». Но этим ни один конкурент выше похвастаться не может.

кавер прекрасное далеко

А самое приятное то, что Shortcut for Google «весит» всего 15 Kb, полностью бесплатен и не содержит рекламу. Даже отсутствие русского языка в интерфейсе при всем желании записать в минус не выйдет, потому что у него вообще нет интерфейса. Распознавание активируется автоматически после запуска приложения.

автоматическое распознавание песни в Shortcut for Google Sound Search

Здесь, на мой взгляд, не хватает только истории поиска. Хотя и это не большая проблема: если вы переходили по ссылкам в поисковой выдаче, то история сохранится в журнале браузера.

Добавить комментарий