Нейромережа навчили розпізнавати окремі голоси (відео)

У Google створили систему машинного навчання, яка здатна виділяти окремі голоси, аналізуючи обличчя людей під час їх розмови. AI створює відео, в якому голоси окремих людей посилюються, а всі інші звуки придушуються.

Дослідники компанії навчили нейромережу розпізнавати окремих людей, що говорять, а потім створили віртуальних «співрозмовників» (в комплекті з фоновим шумом), щоб навчити штучний інтелект виділяти кілька голосів в окремі звукові доріжки. У підсумку ШІ створює відео, в якому голоси окремих людей посилюються, а всі інші звуки придушуються.

Отримані результати вражають: навіть коли люди намагаються конкурувати один з одним, влаштовуючи словесний поєдинок, ШІ здатний згенерувати чисту аудіодоріжку для кожного з них, концентруючись на їхніх обличчях. Причому це можливо навіть в тому випадку, коли людина частково закриває своє обличчя мікрофоном або руками.

В даний час Google вивчає можливості використання цієї функціональності в своїх продуктах. Наприклад, в таких сервісах, як Hangouts і Duo, щоб користувачі могли більш комфортно спілкуватися зі своїми співрозмовниками в людних місцях.

&Nbsp;