Я знаю, нас всех отвлекло другое: в январе 2021 года OpenAI, компания, основанная Илоном Маском и поддерживаемая Microsoft, запустила свой самый амбициозный проект на сегодняшний день: систему машинного обучения под названием ДАЛЛ-Э.
Что делает этот искусственный интеллект? Быстро сказано: он создает изображения, начиная с простого текстового описания. Пример? Напишите «Верблюд с книгой вместо шляпы» или «Галстук из вилок», и он рисует, творит, короче: вытягивает образ.
Теперь Open AI представила вторую версию DALL-E, и все стало чертовски серьезно: разрешение стало намного лучше, а время производства намного меньше. Типичная экспоненциальная динамика, к которой искусственный интеллект нас приучил и, прежде всего, приучит. Еще и потому, что, если вы помните, глава Open AI только что сказал, что эти машины могут (может быть) они становятся разумными.

Немного Валл-И, немного Дали
Первая версия DALL-E (сочетание «Дали» как художника и «ВАЛЛ-И» как анимационного персонажа Диснея) могла генерировать изображения и объединять различные фотографии в коллаж, предлагая перспективы. и вычитание элементов изображения самостоятельно, например, теневые эффекты.
Супер хороший дизайнер, в его распоряжении все изображения мира, который интерпретирует запросы и мгновенно рисует.
«В отличие от механизма 3D-рендеринга, который требует точного ввода, DALL-E часто может «заполнить пробелы», когда подпись подразумевает, что изображение должно включать в себя определенный элемент, который специально не указан», — написала команда в прошлом году. в блоге Open AI.

Как работает ИИ, рисующий по запросу?
DALL-E не задумывался как коммерческий продукт, и команда OpenAI решила, что это будет к лучшему. Исследователи «помешали» ему создавать сексуальные или политические образы, например, чтобы предотвратить использование системы для создания дезинформации. То же самое и с конкретными именами: его невозможно попросить, например, «нарисовать Фрэнка Синатру, играющего в теннис с белым медведем».
DALL-E 1, по сути, использует невероятный интерпретатор языка GPT-3 (здесь я говорю об этом более подробно, если вам интересно) и рисует то, что понимает больше, чем то, что "чувствует".

В отличие от первой версии, которая была доступна всем на веб-сайте OpenAI, эта доступна для тестирования только ограниченному числу партнеров: я жду несколько дней ответа от Open AI, чтобы присоединиться к группе.