Давайте поиграем в небольшую игру: представьте, что вам нужно объяснить кому-то, как поднять чашку, переместить ее и поставить в другое место, не пролив содержимое. Кажется, что это просто, но если вы попытаетесь точно описать каждое движение, вы поймете, что это займет страницы и страницы инструкций. Вот почему гуманоидная робототехника всегда была такой сложной. До вчерашнего дня. С анонсом NVIDIA Isaac GR00T N1 роботы теперь могут понимать и воспроизводить сложные движения, просто наблюдая за действиями человека, благодаря когнитивной архитектуре, которая имитирует как интуитивные, так и рациональные процессы человеческого мозга.
NVIDIA и роботы, искусственный интеллект становится конкретным
Мне очень нравится, как Дженсен Хуанг, генеральный директор NVIDIA, заявил во время своего выступления на GTC 2025: «Наступила эра робототехники общего назначения». Это не пустой лозунг, а констатация факта. Впервые у нас есть открытая и настраиваемая базовая модель, которая позволяет гуманоидным роботам рассуждать и действовать в реальном мире.
Il GR00T N1 (Технология универсального робота 00) — это не просто очередной лабораторный эксперимент. Это технология, которая уже доступна разработчикам по всему миру и призвана преобразовать отрасли, страдающие от нехватки рабочей силы (по оценкам, более 50 миллионов человек во всем мире).
Двухскоростной мозг
Что делает GR00T N1 по-настоящему необычным, так это его архитектура, вдохновленная человеческим познанием: Система 1 которая работает как модель «быстрого действия» (аналогично нашим рефлексам) и Система 2 который действует как «медленное мышление», способное рассуждать об окружающей среде и планировать сложные действия.
Эта двойственность позволяет роботам выполнять задачи, которые кажутся простыми для нас, людей, но невероятно сложны для машин: хватать предметы, перемещать их одной или обеими руками и перекладывать их из одной руки в другую. Они даже могут выполнять многоэтапные операции, требующие расширенного контекста и сочетания различных навыков.
NVIDIA и роботы: от моделирования к реальности
NVIDIA не просто разработала модель, она создала целую экосистему для человекоподобных роботов. В сотрудничестве с Google DeepMind e Disney Research, компания разрабатывает Ньютон, физический движок с открытым исходным кодом, оптимизированный для обучения роботов.
Использование компонентов Чертеж NVIDIA Isaac GR00T, можно было сгенерировать 780.000 6.500 синтетических траекторий (что эквивалентно 11 часам или девяти непрерывным месяцам человеческих демонстраций) всего за XNUMX часов. Сочетание синтетических и реальных данных производительность GR00T N1 улучшилась на 40% по сравнению с использованием только реальных данных.
Открытое будущее
Реальное изменение, как вы, возможно, догадались, заключается в открытом подходе. Данные обучения GR00T N1 и сценарии оценки доступны для загрузки по адресу Обнимая лицо e GitHub. Это позволит разработчикам и исследователям со всего мира участвовать в создании все более эффективных и полезных человекоподобных роботов.
Компании, подобные Технологии 1X, Робототехника Аджилити, Бостонская динамика и другие уже получили ранний доступ к этой технологии, и результаты впечатляют. Бернт Борних, генеральный директор 1X Technologies, сказал, что с минимальным объемом постобучения они смогли полностью внедрить систему на своем роботе НЕО Гамма.
Мы больше не находимся в сфере обещаний: эпоха универсальной робототехники действительно началась.