Make-A-Video, искусственный интеллект Meta создает видео, начиная с текста.

30 сентября 2022

Технология

После генераторов изображений из текстов пришло время клипов: Make-A-Video ставит компанию Цукерберга во главе исследований.

Мы до сих пор не оправились от наступления ДАЛЛ-Е2, Midjourney и спутники, о которых объявила Мета Сделать видео, инструмент, который генерирует короткие видеоклипы из текстовых описаний. Это следующий шаг в мире контента, создаваемого искусственным интеллектом.

Впервые инструмент преобразования текста в видео подошел так близко к финальному запуску. «Исследования в области искусственного интеллекта способствуют творческому самовыражению, предоставляя людям инструменты для быстрого и легкого создания нового контента», — говорится в сообщении. пресс-релиз презентация.

Make-A-Video может воплотить в жизнь творческие идеи с помощью нескольких слов или строк текста и создать характерные фильмы, богатые цветами, персонажами и декорациями. Система также может преобразовывать существующие фотографии или видео в похожие новые фильмы.

Отличный выстрел, Дэвид

«Создавать видео гораздо сложнее, чем фотографии», — говорит генеральный директор Meta. Марк Цукерберг в сообщение на Facebook. Но идти, я не думал. «Помимо правильной генерации каждого пикселя, система должна также предсказывать, как они будут меняться с течением времени. Make-A-Video решает эту проблему, добавляя уровень обучения без учителя, который позволяет системе понимать движение в физическом мире и применять его к традиционному преобразованию текста в изображение».

Il веб-сайт Компания Make-A-Video представляет несколько примеров видеороликов, созданных ИИ, таких как «собака в костюме супергероя с красной накидкой, летящая в небе» и «рисунок плюшевого мишки». Это еще одна демонстрация невероятно быстрого прогресса этих систем. Только два? Три года назад? Эти вещи были практически научной фантастикой.

Сделать видео — Скриншот из клипа «рисующего медведя», созданного искусственным интеллектом Make-A-Video.

Make-A-Video, чудо (и, конечно же, опасности)

Поскольку мы все больше полагаемся на искусственный интеллект для создания произведений искусства, компаниям будет все более важно принимать политику прозрачности в отношении этих алгоритмов. Читая исследовательскую работу Make-A-Video, становится ясно, что этот искусственный интеллект был «обучен» с использованием подмножества набора данных под названием LAOIN, который также включает не совсем чистые изображения. Который? Казни ИГИЛ, нагота без согласия и так далее. Meta гарантирует, что они тщательно просмотрели эти данные, автоматически отбрасывая обнаженные и другие ложные изображения.

Будет. Тем временем битва за этику продолжается.

Внедрение преобразования текста в видео в качестве инструмента для художников и создателей также усложняет (и без того острый) вопрос о легитимности искусства, созданного ИИ. Знаете, в августе парень по имени Джейсон Аллен выиграл художественный конкурс, используя изображение, созданное Midjourney, что вызвало бурю споров.

Даже компании, собирающие изображения для коммерческого использования (например, Shutterstock или Getty Images), закрыли дверь для этого контента. В данном случае никаких этических вопросов. Только легально. Кому принадлежат изображения, используемые алгоритмами для обучения? Является ли превращение этих изображений в новые вещи нарушением авторских прав или нет? Законы еще не адаптировались.

Тем временем цунами продолжается: эти технологии буквально захлестывают общественность с той же скоростью, с которой они учатся совершенствоваться. Вчерашний анонс на Make-A-Video последовал всего за один день до публичный релиз ДАЛЛЕ-2 от OpenAI. Компания, разработавшая DALLE-2, устранила список ожидания системы, позволив любому человеку генерировать изображения из строк текста.

Но даже несмотря на то, что общественность имеет доступ ко все большему количеству инструментов искусственного интеллекта для создания произведений искусства, некоторые фундаментальные этические вопросы об их использовании остаются открытыми: и они требуют ответов.

Джанлука Риччио, креативный директор Melancia adv, копирайтер и журналист. Он является частью Итальянского института будущего, Общества мирового будущего и H+. С 2006 года он руководит Futuroprossimo.it, итальянским футурологическим ресурсом.

Сообщать об исследованиях, открытиях и изобретениях, обращайтесь в редакцию! Следите за Футуро Проссимо в WhatsApp: эксклюзивные новости и обновления (бесплатно).

ФП на Фатто Котидиано
Альберто Робиати и Джанлука Риччио знакомят читателей со сценариями будущего: возможностями, рисками и возможностями, которые у нас есть, чтобы создать возможное будущее.

По той же теме:

Последний

Make-A-Video, искусственный интеллект Meta создает видео, начиная с текста.

Технология

Поделиться

Отличный выстрел, Дэвид

Make-A-Video, чудо (и, конечно же, опасности)

Будет. Тем временем битва за этику продолжается.

Супермаркет Orwell: покупки с помощью распознавания лиц необходимо переосмыслить

VASA-1, искусственный интеллект Microsoft, создает сверхреалистичных персонажей всего из одной фотографии

Амодей, Anthropic: «ИИ скоро сможет воспроизводиться и выживать автономно»

Переработка аккумуляторов 2.0, надгробие на тему «электромобиль да или нет?»

Синтетические, но живые: клетки, которые бросают вызов границе между искусственным и биологическим

Германия, год назад мы попрощались с атомной энергетикой: почему они не вернутся

Геркуланум раскрывает тайны Платона: реконструируется его конец

Перерабатывайте пластик бесконечно: новые передовые технологии переработки