«Яндекс» создал «убийцу» Shazam для мессенджера Telegram

Интернет Веб-сервисы Техника Российское ПО
мобильная версия
, Текст: Павел Притула
«Яндекс.Музыка» испытывает новую технологию распознавания музыки, которая позволит более точно отвечать на вопрос пользователей: «Как называется песня, которую я сейчас слушаю». В ее основе – самообучающаяся нейросеть.

В мессенджере Telegram заработал бот «Яндекс.Музыки», способный распознавать мелодию, которую слышит пользователь. Как и при использовании популярных сервисов Shazam или Soundhound, достаточно включить микрофон устройства при запущенном боте, и через несколько секунд на экране появятся название трека и ссылка на него на «Яндекс.Музыке».

Раньше «Яндекс» уже использовал собственную технологию распознавания в мобильном приложении «Яндекс.Музыки». Она основана на сравнении спектрограмм присланного пользователем отрывка и записей из имеющейся базы музыкальных произведений. Сам «Яндекс» отмечал, что у нее были ограничения: на точность распознавания сильно влиял окружающий шум при записи отрывка.

Сравнение сигнатур на спектрограммах

Бот, как сообщается в корпоративном блоге «Яндекса», не копирует старую технологию. В его основе лежит другой подход. Если раньше проводилось сравнение сигнатур треков по набору правил, которые как раз и не могли описать возможные искажения звука, то сейчас задача распознавания возложена на нейросеть. Она действует не по жестким правилам, а на основе самостоятельно принятых решений. Для повышения точности распознавания в нейросеть загружается большое количество образцов музыки с разнообразными искажениями, на которых она самообучается.

В настоящее время, по сообщению компании, бот работает в тестовом режиме и способен распознавать несколько миллионов треков из базы «Яндекс.Музыки». В дальнейшем планируется расширение его «кругозора» за пределы «Яндекс.Музыки». Кроме того, компания планирует создать использовать эту технологию и в других своих продуктах, не ограничиваясь ботом в Telegram.

CNews100: Крупнейшие ИТ-компании России 2016

№ 2016 Название компании Совокупная выручка компании в 2016 г., c НДС, ₽тыс. Рост выручки 2016/2015
1 НКК 163 958 372 16,4%
2 Ланит 114 514 106 11,4%
3 Epam* 77 612 831 40,0%
4 Softline 57 291 368 20,5%
5 Техносерв 52 442 285 1,3%
6 Газпром Автоматизация*** 50 756 310 -15,9%

смотреть полный рейтинг

Крупнейшие ИТ-разработчики России 2016

№ 2016 Название компании Город (расположение центрального офиса) Выручка от продажи продуктов собственной разработки (АО, ПО, в том числе продукты, поставляемые по модели SaaS) в 2016 г., с НДС, ₽тыс.
1 Epam* Ньютаун (США) 77 612 831
2 Luxoft * Цуг (Швейцария) 50 215 140
3 Лаборатория Касперского* Москва 43 083 600
4 1С** Москва 37 300 000
5 Cognitive Technologies Москва 28 390 373

смотреть полный рейтинг