Нейросеть научили распознавать отдельные голоса (ВИДЕО)

В Google создали систему машинного обучения, которая способна выделять отдельные голоса, анализируя лица людей во время их разговора. ИИ создает видео, в котором голоса отдельных людей усиливаются, а все остальные звуки подавляются.

Исследователи компании обучили нейросеть распознавать отдельных говорящих людей, а затем создали виртуальных «собеседников» (в комплекте с фоновым шумом), чтобы научить искусственный интеллект выделять несколько голосов в отдельные звуковые дорожки. В итоге ИИ создаёт видео, в котором голоса отдельных людей усиливаются, а все другие звуки подавляются.

Полученные результаты впечатляют: даже когда люди пытаются конкурировать друг с другом, устраивая словесный поединок, ИИ способен сгенерировать чистую аудиодорожку для каждого из них, концентрируясь на их лицах. Причём это возможно даже в том случае, когда человек частично закрывает своё лицо микрофоном или руками.

В настоящее время Google изучает возможности использования этой функциональности в своих продуктах. Например, в таких сервисах, как Hangouts и Duo, чтобы пользователи могли более комфортно общаться со своими собеседниками в людных местах.

Как сохранить зелень свежей надолго

Змінюйте вашу кар’єру: Trud.com запускає конструктор професійних резюме з безкоштовними шаблонами!

Как отмыть микроволновку

“Ароматы ванили….” или Как заставить свой дом пахнуть приятно

ТОП-5 популярних смарт-годинників для дітей +Рекомендації щодо вибору

Найкращі ігрові приставки та консолі

Найкращі електронні книги: ТОП-5

ТОП-3 Sous Vide вакуумні печі. +Плюси та мінуси технології