Google только что представил Близнецов, это новый рубеж в области искусственного интеллекта, демонстрация которого ошеломила мир. Видео, размещенное на YouTube, демонстрирует необычайную способность Близнецов интерпретировать визуальные и вербальные стимулы и реагировать на них.
Казалось бы, простой тест быстро превращается в невероятную демонстрацию «почти человеческих» способностей этого ИИ в понимании и взаимодействии с окружающим миром.
Google Gemini: квантовый скачок в искусственном интеллекте
Появление Google Gemini (о котором мы рассказывали в сентябре прошлого года) при первых же объявлениях) знаменует собой поворотный момент в развитии искусственного интеллекта. Способность Близнецов интерпретировать и реагировать на различные визуальные и вербальные сигналы превосходит все, что мы до сих пор видели в технологиях искусственного интеллекта.
Это не просто прорыв в области визуального распознавания или понимания естественного языка. То, что вы видите в демонстрации, — это чрезвычайно плавная интеграция обеих возможностей, которая приближает ИИ к истинному пониманию человеческого контекста.
Демо-версия Google Gemini: окно в будущее
Прежде всего, если вы пропустили это, вы ДОЛЖНЫ это увидеть. Вот она:
Демонстрация начинается с того, что участник-человек просит Близнецов описать то, что он видит. Простое действие — положить стикер и провести на нем импровизированную линию — легко интерпретируется Близнецами. Но именно продолжение испытания раскрывает истинную силу Близнецов.
Когда рисунок превращается в узнаваемую фигуру — утку, Близнецы не только правильно идентифицируют объект, но и предоставляют подробную информацию об окружающей среде, демонстрируя полное понимание визуального контекста.
До неузнаваемости: взаимодействие и перевод
Интеллект Google Gemini не ограничивается простой визуальной интерпретацией. Когда участник представляет игры и запросы на перевод, Близнецы точно реагируют. Его способность переводить слово «утка» на разные языки, а также понимать простые игры и участвовать в них подчеркивает уровень интерактивности и универсальности, который раньше казался исключительной прерогативой людей.
Практическое применение такой технологии, как Google Gemini? Эх. Определить его пределы невозможно. От хирургии до образования, от домашних применений до творческих индустрий — возможности кажутся безграничными. Gemini может произвести революцию в том, как мы взаимодействуем с технологиями, сделав человеко-машинный интерфейс более интуитивным, естественным и эффективным.
Да, но когда мы сможем им воспользоваться?
После искреннего восхищения увиденным в демо, искренности за искренность, я должен также отметить, что до сих пор «жира» от Google было немного. Бард, втянутый на арену противостояния с ChatGPT OpenAI e Клод от Anthropic возлагали слишком много ожиданий. Технология «в поле» уступает технологиям конкурентов (ограничено языковой моделью: другой ИИ, например, у Deepmind отличные результаты грядут). И тот факт, что у Google Gemini до сих пор нет официальной даты запуска, вызывает некоторое разочарование.
Возможно, это кажется «слишком продвинутым, чтобы быть правдой», может быть, это потому, что вам не терпится разобраться с этим, но время демонстраций прошло. Демо-версия Google Gemini обещает преодолеть текущие ограничения технологий искусственного интеллекта: давайте посмотрим на это в действии.
Не дайте мне заподозрить, что это всего лишь еще один способ тянуть время.
Изменить 8/12/2023: Вот, пожалуйста. Даже не делая этого специально. После настойчивых требований многих пользователей Google признает, что фактическая демо-версия Gemini была создана «с использованием кадров из фильма и текстовых сообщений», вместо того, чтобы Gemini реагировала на рисунок или изменение объектов на столе в реальном времени или даже предсказывала это. Это гораздо менее впечатляюще, чем можно было бы поверить в видео, и, что еще хуже, отсутствие заявления о фактическом методе ввода делает готовность Gemini весьма сомнительной, как и поведение Google.