«Яндекс» создал «убийцу» Shazam для мессенджера Telegram
В мессенджере Telegram заработал бот «Яндекс.Музыки», способный распознавать мелодию, которую слышит пользователь. Как и при использовании популярных сервисов Shazam или Soundhound, достаточно включить микрофон устройства при запущенном боте, и через несколько секунд на экране появятся название трека и ссылка на него на «Яндекс.Музыке».
Раньше «Яндекс» уже использовал собственную технологию распознавания в мобильном приложении «Яндекс.Музыки». Она основана на сравнении спектрограмм присланного пользователем отрывка и записей из имеющейся базы музыкальных произведений. Сам «Яндекс» отмечал, что у нее были ограничения: на точность распознавания сильно влиял окружающий шум при записи отрывка.
Бот, как сообщается в корпоративном блоге «Яндекса», не копирует старую технологию. В его основе лежит другой подход. Если раньше проводилось сравнение сигнатур треков по набору правил, которые как раз и не могли описать возможные искажения звука, то сейчас задача распознавания возложена на нейросеть. Она действует не по жестким правилам, а на основе самостоятельно принятых решений. Для повышения точности распознавания в нейросеть загружается большое количество образцов музыки с разнообразными искажениями, на которых она самообучается.
В настоящее время, по сообщению компании, бот работает в тестовом режиме и способен распознавать несколько миллионов треков из базы «Яндекс.Музыки». В дальнейшем планируется расширение его «кругозора» за пределы «Яндекс.Музыки». Кроме того, компания планирует создать использовать эту технологию и в других своих продуктах, не ограничиваясь ботом в Telegram.