Редактировать видео становится чрезвычайно легко (и я не думаю, что это просто хорошо) редактировать видео, а последние разработки в области искусственного интеллекта действительно впечатляют.
Сотрудничество гигантов (Стэнфордского и Принстонского университетов, а также Института информатики Макса Планка и Adobe) позволяет изменять речь в видео, просто изменяя текстовую транскрипцию, не создавая эффекта «дубляжа».
Другими словами, человек, который говорит по видео, буквально изменит слова своей речи, также изменяя движения губ.
Чтобы получить этот несколько тревожный результат, алгоритм «учит» фонемы и их произношение субъектом видео и создает точную 3D-модель его лица, способную воспроизвести все звуки и движения: в этот момент достаточно отредактировать текст выступления и алгоритм заменит исходное предложение.
В настоящее время алгоритму требуется не менее 40 минут отснятого материала, чтобы «обучиться» воспроизводить человека в фильме.
Вот видео, демонстрирующее, как работает система:
Огромные этические сомнения
Ясно, что этот механизм создает возможность того, что любой может изменить дискурс (возможно, политических или общественных деятелей), вставляя элементы ненависти или дезинформации и распространяя их как оригинальные и естественные: это только усиливает опасения по поводу распространения систем на основе на фальшивом
С другой стороны, есть и некоторая положительная сторона, и она заключается в огромной экономии, которую получит монтаж, избежав необходимости переснимать целые сцены из-за мелких ошибок в произношении.
В остальном я уверен, что и для видео будут разработаны и другие методы «антиподделки»: динамические водяные знаки или водяные знаки, которые еще больше усложняют работу искусственного интеллекта, в соревновании реальности и манипуляции, которое уже, кажется, призвано характеризовать следующие годы.