Вот ИИ, который может предсказать следующие 25 кадров фильма

Ноябрь 8 2019

9111e53b 814e 4a68 8861 c83fb5141ae6 e1573163524251

Технология

Искусственный интеллект способен достаточно точно предсказать, какими будут 25 будущих кадров этого фильма.

Алгоритмы искусственного интеллекта и машинного обучения становятся лучше при прогнозировании действий в видео.

Лучшие из современных алгоритмов могут довольно точно предсказать, куда пойдет бейсбол после его броска или появление дороги в следующей последовательности. Другими словами? Прогнозирование кадров в будущем фильма.

Новый подход, предложенный исследователями из Google, Мичиганского университета и Adobe, расширяет современный уровень техники с помощью крупномасштабных моделей, которые генерируют высококачественное видео всего из нескольких кадров.

«С помощью этого проекта мы стремимся получить точные видеопрогнозы. Будем оптимизировать возможности нейросети», исследователи написали в документ который описывает их работу.

Модель команды

Базовая модель команды основана на стохастической архитектуре генерации видео. с компонентом, который управляет предсказаниями кадров, следующих за рассмотренными.

Команда обучала и тестировала различные версии модели отдельно от пользовательских наборов данных на основе трех категорий прогноза: взаимодействия между объектами, структурированное движение и частичная наблюдаемость.

Для первого задания (взаимодействие с объектами) Исследователи выбрали 256 клипов из блока видеороликов, на которых показана рука робота во время взаимодействия с полотенцами.

Для второго (структурированное движение) они редактировали клипы из Human 3.6M, блок, содержащий клипы людей, выполняющих такие действия, как сидя на стуле.

Что касается третьего (частичная наблюдаемая активность), использовали набор данных KITTI для управления движением с открытым исходным кодом, собранный с видеокамер, установленных на приборной панели автомобиля

После такого «обучения» модель ИИ генерировала до 25 кадров в будущее.

Исследователи сообщают, что оценщики предпочитали «прогнозы» в 90,2%, 98,7% и 99,3% случаев трем типам видео: взаимодействия объектов, структурированное движение и задачи частичного наблюдения соответственно.

В качественном плане команда отмечает, что ИИ четко изобразил человеческие руки и ноги и готово. «очень точные предсказания, которые казались реалистичными по сравнению со сценами, изображенными на видео» .

Модель искусственного интеллекта при обеспечении кадрами видео данных человеческих действий

Модель искусственного интеллекта при обеспечении кадрами видео данных автомобильной камеры.

«Мы обнаружили, что максимизация мощности таких моделей улучшает качество прогнозирования видео», соавторы пишут. Мы надеемся, что наша работа побудит эту область двигаться в том же направлении в будущем. Например, чтобы посмотреть, как далеко мы сможем зайти».

Сколько минут будущего вы можете себе представить?

Джанлука Риччио, креативный директор Melancia adv, копирайтер и журналист. Он является частью Итальянского института будущего, Общества мирового будущего и H+. С 2006 года он руководит Futuroprossimo.it, итальянским футурологическим ресурсом.

Сообщать об исследованиях, открытиях и изобретениях, обращайтесь в редакцию! Следите за Футуро Проссимо в WhatsApp: эксклюзивные новости и обновления (бесплатно).

ФП на Фатто Котидиано
Альберто Робиати и Джанлука Риччио знакомят читателей со сценариями будущего: возможностями, рисками и возможностями, которые у нас есть, чтобы создать возможное будущее.

По той же теме:

Последний

Вот ИИ, который может предсказать следующие 25 кадров фильма

Технология

Поделиться

Алгоритмы искусственного интеллекта и машинного обучения становятся лучше при прогнозировании действий в видео.

Модель команды

Сколько минут будущего вы можете себе представить?

Новости, которые мы ожидаем от 2024 года: это будет год, которому вы не поверите

Появляется Google Gemini, и от этого захватывает дух: но когда его можно будет использовать?

Конец человечества: 14 ловушек, с которыми никто не смеет столкнуться

Хавелар, строительство будущего: печать за 18 часов, доставка за 6 недель

Как ИИ раскроет потенциал учащихся с дислексией и СДВГ

Овертуризм: платный вход в Венецию — это будущее городов искусства?

Переработка аккумуляторов 2.0, надгробие на тему «электромобиль да или нет?»

Синтетические, но живые: клетки, которые бросают вызов границе между искусственным и биологическим