Мы до сих пор не оправились от наступления ДАЛЛ-Е2, Midjourney и спутники, о которых объявила Мета Сделать видео, инструмент, который генерирует короткие видеоклипы из текстовых описаний. Это следующий шаг в мире контента, создаваемого искусственным интеллектом.
Впервые инструмент преобразования текста в видео подошел так близко к финальному запуску. «Исследования в области искусственного интеллекта способствуют творческому самовыражению, предоставляя людям инструменты для быстрого и легкого создания нового контента», — говорится в сообщении. пресс-релиз презентация.
Make-A-Video может воплотить в жизнь творческие идеи с помощью нескольких слов или строк текста и создать характерные фильмы, богатые цветами, персонажами и декорациями. Система также может преобразовывать существующие фотографии или видео в похожие новые фильмы.
Отличный выстрел, Дэвид
«Создавать видео гораздо сложнее, чем фотографии», — говорит генеральный директор Meta. Марк Цукерберг в сообщение на Facebook. Но идти, я не думал. «Помимо правильной генерации каждого пикселя, система должна также предсказывать, как они будут меняться с течением времени. Make-A-Video решает эту проблему, добавляя уровень обучения без учителя, который позволяет системе понимать движение в физическом мире и применять его к традиционному преобразованию текста в изображение».
Il веб-сайт Компания Make-A-Video представляет несколько примеров видеороликов, созданных ИИ, таких как «собака в костюме супергероя с красной накидкой, летящая в небе» и «рисунок плюшевого мишки». Это еще одна демонстрация невероятно быстрого прогресса этих систем. Только два? Три года назад? Эти вещи были практически научной фантастикой.
Make-A-Video, чудо (и, конечно же, опасности)
Поскольку мы все больше полагаемся на искусственный интеллект для создания произведений искусства, компаниям будет все более важно принимать политику прозрачности в отношении этих алгоритмов. Читая исследовательскую работу Make-A-Video, становится ясно, что этот искусственный интеллект был «обучен» с использованием подмножества набора данных под названием LAOIN, который также включает не совсем чистые изображения. Который? Казни ИГИЛ, нагота без согласия и так далее. Meta гарантирует, что они тщательно просмотрели эти данные, автоматически отбрасывая обнаженные и другие ложные изображения.
Будет. Тем временем битва за этику продолжается.
Внедрение преобразования текста в видео в качестве инструмента для художников и создателей также усложняет (и без того острый) вопрос о легитимности искусства, созданного ИИ. Знаете, в августе парень по имени Джейсон Аллен выиграл художественный конкурс, используя изображение, созданное Midjourney, что вызвало бурю споров.
Даже компании, собирающие изображения для коммерческого использования (например, Shutterstock или Getty Images), закрыли дверь для этого контента. В данном случае никаких этических вопросов. Только легально. Кому принадлежат изображения, используемые алгоритмами для обучения? Является ли превращение этих изображений в новые вещи нарушением авторских прав или нет? Законы еще не адаптировались.
Тем временем цунами продолжается: эти технологии буквально захлестывают общественность с той же скоростью, с которой они учатся совершенствоваться. Вчерашний анонс на Make-A-Video последовал всего за один день до публичный релиз ДАЛЛЕ-2 от OpenAI. Компания, разработавшая DALLE-2, устранила список ожидания системы, позволив любому человеку генерировать изображения из строк текста.
Но даже несмотря на то, что общественность имеет доступ ко все большему количеству инструментов искусственного интеллекта для создания произведений искусства, некоторые фундаментальные этические вопросы об их использовании остаются открытыми: и они требуют ответов.