Видео Тейлор Свифт, которого не было, выступление на TED, которого не было, лекция Эйнштейна, которой не было. Это не кинематографические спецэффекты, а невероятные творения ОмниХьюман-1, новая система искусственного интеллекта для создания поддельных видеороликов, разработанная ByteDance («владелец» TikTok), который переопределяет границы между реальностью и цифровой фантастикой.
Беспрецедентная технология
Видео Deepfake в них нет ничего нового в цифровом ландшафте. Уже существует множество приложений, способных вставить человека в фотографию или заставить его сказать то, чего он никогда не говорил. Однако большая часть этого сфальсифицированного контента имеет явные признаки искусственности. OmniHuman-1, похоже, преодолел это ограничение, показав удивительно реалистичные результаты.
Для создания deepfake-видео системе требуется всего два элемента: эталонное изображение и аудиофайл, который может представлять собой речь или голосовую дорожку. Используя эти минимальные входные данные, OmniHuman-1 может создавать клипы любой длины с регулируемыми соотношениями сторон и полным контролем над представлением объекта. Система была обучена на 19.000 XNUMX часах видеоконтента (из нераскрытых источников).
Расширенные возможности манипуляции
Возможности OmniHuman-1 выходят за рамки простой генерации видео. Система также может изменять существующие кадры, даже изменяя движения конечностей людей. Результаты, показанные командой ByteDance, невероятно убедительны, хотя и не без ограничений: если их «кормить» низкокачественными референсными изображениями, результаты будут хуже, а некоторые позы все еще проблематичны. Однако степень детализации, достигнутая OmniHuman-1, вызывает серьезные опасения, в и без того довольно напряжённой картине.
в 2024политические дипфейки уже вызвали серьезные проблемы: на Тайване группа, связанная с Коммунистической партией Китая, опубликовала сфальсифицированную аудиозапись политика; В Молдове появились фейковые видео, демонстрирующие фейковую отставку президента Майя Санду; в Южной Африке, подделка Eminem он поддерживал оппозиционную партию.
второй Deloitteтолько в Соединенных Штатах контент, созданный с помощью ИИ, способствовал Потери от мошенничества превысят 12 миллиардов долларов в 2023 году, а к 40 году, по прогнозам, могут достичь 2027 миллиардов долларов. Потребители обманываются с помощью фейковых аккаунтов знаменитостей, рекламирующих мошеннические инвестиции, в то время как цифровые мошенники обманывают компании на миллионы. Научное сообщество призывает к жесткому регулированию, и несколько организаций рассматривают законопроект, который позволит судьям отдавать распоряжения об удалении фейковых видеороликов, предусматривая возможные денежные штрафы для нарушителей.
Видео Deepfake: тяжелая битва за обнаружение
Обнаружение поддельных видеороликов остается серьезной проблемой. Несмотря на усилия социальных сетей и поисковых систем по ограничению его распространения, объем манипулируемого контента в Интернете продолжает расти тревожными темпами. Опрос Jumio 2024 года показывает, что За последний год 60% людей сталкивались с дипфейками, а 72% опасаются ежедневной обмана.
ByteDance пока не представила OmniHuman-1 публично, но опыт показывает, что сообществу ИИ не потребуется много времени, чтобы воспроизвести аналогичные системы. Это поднимает важные вопросы о будущем цифровой правды и необходимости разработки эффективных инструментов для защиты общества от этой все более мощной и все более опасной технологии.