Нейросеть генерирует пугающие лица под музыку

По

01.11.2020

226

views

Одна из перспективных сфер применения искусственного интеллекта – автоматизированная обработка изображений. Частично благодаря огромному количеству фотографий других людей и самих себя, которые пользователи массово загружают в интернет, нейросети удается обучить работать с такими изображениями. Алгоритмы могут, например, «состарить» человека на фотографии или создать целую коллекцию реалистичных портретов людей, которых на самом деле не существует.

Можно с уверенностью утверждать, что сфера стоковых фотографий навсегда изменится с внедрением искусственного интеллекта. Однако Марио Клингеманн задался другим вопросом – что получится, если настроить нейросеть так, чтобы она генерировала лица под музыку, причем усилению ритма соответствовали бы самые яркие эмоции.

Клингеманн использовал систему искусственного интеллекта StyleGAN2, изначально созданную в Nvidia и опубликованную в открытом доступе около года назад. Разработчик не стал самостоятельно проводить дополнительное обучение нейросети, однако он настроил алгоритм с учетом звукового спектра аудиофайла, в данном случае, песни Triggernometry группы Kraftamt.

Некоторые подписчики Клингеманна в Twitter рекомендовали ему убрать из видеоролика особенно устрашающие изображения, созданные нейросетью. На самом деле, весь ужас некоторых фотографий можно оценить, только если постепенно просматривать видео кадр за кадром.