Становится очень легко (и я не думаю, что это только хорошо) изменять видео, а последние разработки в области искусственного интеллекта действительно впечатляют.
Сотрудничество между гигантами (Стэнфордский университет и Принстон, а также Институт информатики Макса Планка и Adobe) позволяет изменить речь в видео, просто изменив текстовую транскрипцию и не создавая эффекта «дублирования».
Другими словами, человек, который говорит по видео, буквально изменит слова своей речи, также изменяя движения губ.
Чтобы добиться этого несколько тревожного результата, алгоритм «учит» фонемы и их произношение у субъекта на видео и создает точную 3D-модель его лица, способную воспроизвести все звуки и движения: в этот момент достаточно будет отредактировать текст выступления, и алгоритм заменит исходное предложение.
В настоящее время алгоритму требуется не менее 40 минут видео, чтобы «обучиться» воспроизводить человека на видео.
Вот видео, демонстрирующее, как работает система:
Огромные этические сомнения
Ясно, что этот механизм создает возможность того, что любой может изменить дискурс (возможно, политических или общественных деятелей), вставляя элементы ненависти или дезинформации и распространяя их как оригинальные и естественные: это только усиливает опасения по поводу распространения систем на основе на фальшивом
С другой стороны, есть и положительные стороны, и они заключаются в огромной экономии, которую даст монтаж, избегая пересъемки целых сцен из-за мелких ошибок произношения.
В остальном, я уверен, что для видео будут разработаны и другие методы «защиты от подделок»: динамические водяные знаки или водяные знаки, которые еще больше усложняют работу искусственного интеллекта, в соревновании между реальностью и манипуляцией, которое уже, кажется, суждено характеризовать. следующие годы.