НОВОСТИ

В MIT научили ИИ распознавать музыкальные инструменты по видео

Анна Колянчук 6 июля 2018, 18:35

Искусственный интеллект PixelPlayer, разработанный в Массачусетском технологическом институте (MIT), научился выделять из музыкального файла дорожки с отдельными инструментами, сообщает MIT News.
PixelPlayer может распознавать музыкальные инструменты в аудио или видеофайлах. Разработка задействует не один, а сразу три алгоритма. Первый обрабатывает видеоряд, второй — аудиодорожку, а третий синхронизирует данные. PixelPlayer определяет звук, относящийся к каждому пикселю изображения. Таким образом нейросеть обнаруживает отдельные инструменты и определяет издаваемую мелодию.

Ключевая особенность разработки заключается в использовании метода спонтанного обучения. В аналогичных разработках ранее использовался метод контролируемого обучения. В качестве вводных данных ИИ получал маркированные аудиофайлы, ручная разметка которых требовала много времени. PixelPlayer обрабатывает видео — это позволяет отказаться от предварительной подготовки информации. Спонтанное обучение устранило человеческий фактор и ускорило процесс.
Для обучения ИИ использовали 60 часов музыкального видео.
PixelPlayer пока далек от совершенства: он может идентифицировать только 20 музыкальных инструментов и пока испытывает трудности с распознаванием похожих звуков. Разработчики ожидают, что в дальнейшем с его помощью можно будет редактировать аудио и улучшать архивные звуковые записи.

Читайте также

Что (не)так с Black Friday. Откуда пошла традиция и почему не стоит бояться больших скидок

Открыть бизнес за границей. Как получить средства на новое дело в ЕС

Как купить USDT через обменник. Подробная инструкция

TemplateMonster — 20 лет. История компании от маленькой вебстудии до маркетплейса из 175 000 продуктов

Международная IT-компания Astound Commerce набирает людей в команду. Кого именно ищут и почему вы захотите там работать

Сохранение позиций на рынке, йога онлайн, покупка Starlink. Как Govitall работает во время войны

Еще один «Дон Кихот». Как беларус создал приложение для высмеивания путинской пропаганды и почему это вызывает дежавю

Новые услуги и поддержка Украины. Как в FAVBET адаптировали работу и продукт военные реалии

30 докладов об IT и сбор средств на ВСУ. Что будет на международной IТ-конференции NIX MultiConf

Калиновый венок и символы войны. Morphy.vision создала AR-фильтр в рамках open call от Banda и Brave.ua