Компанія Google DeepMind анонсувала вихід нової мовної моделі штучного інтелекту — Gemini Robotics On-Device. Її головна особливість полягає в тому, що вона здатна працювати без підключення до Інтернету. Розробка призначена для управління фізичними роботами й орієнтована на автономне виконання завдань без передачі даних у хмару.
Про це повідомляє Techcrunch.
Модель базується на попередній версії Gemini Robotics, представленій у березні. Оновлена система має ширші можливості керування рухами роботів і підтримує взаємодію з людиною через природну мову. Завдяки цьому розробники можуть налаштовувати поведінку роботів за допомогою текстових підказок.
Рівень якості, близький до хмарної версії
Google заявляє, що нова модель показала себе на рівні з хмарною версією Gemini Robotics, коли мова йде про стандартні бенчмарки. Ба більше — у порівнянні з іншими автономними моделями, що працюють безпосередньо на пристроях, Gemini Robotics On-Device нібито демонструє вищу продуктивність, хоча сам список моделей-конкурентів компанія не оприлюднила.

У рамках демонстрації Google показала, як роботи з локальною моделлю успішно виконують побутові завдання: розстібання блискавок на сумках, складання одягу, сортування предметів тощо.
Важливо, що ці завдання виконувалися без попереднього «знайомства» моделі з конкретними об’єктами. Хоча модель спочатку створювалася для роботів ALOHA, надалі її успішно адаптували до дворукого робота Franka FR3 і гуманоїда Apollo від Apptronik. Робот Franka, наприклад, зміг ефективно справлятися з незнайомими для нього сценаріями — наприклад, складанням предметів на рухомому конвеєрі.
Крім того, Google DeepMind представила Gemini Robotics SDK — комплект інструментів, який дозволяє розробникам навчати роботів новим діям, демонструючи їм від 50 до 100 прикладів. Процес навчання може здійснюватися в симуляторі MuJoCo, перш ніж модель застосовується до фізичного пристрою.
Ринок робототехніки стає дедалі конкурентнішим
На тлі зростання інтересу до інтеграції ШІ в робототехніку, інші технологічні компанії також роблять активні кроки у цьому напрямку. Зокрема, Nvidia розробляє платформу для створення базових моделей для гуманоїдів, а Hugging Face працює не лише над відкритими ШІ-моделями, а й над повноцінними роботизованими системами.
Не відстають і стартапи: наприклад, південнокорейська компанія RLWRLD, яку підтримує інвестфонд Mirae Asset, займається створенням універсальних моделей для роботів.
Також нещодавно редакція сайту AI360 розповідала про те, як компанія Figure AI готує прорив робототехніки з UPS та BMW. Figure AI, відома розробкою людиноподібних роботів, продовжує активно розвиватися, попри хвилю скептицизму щодо своїх партнерств і комерційної діяльності.
Генеральний директор стартапу Бретт Адкок виступив на конференції Bloomberg Tech. Там, він прокоментував останні обвинувачення, зокрема щодо співпраці з автовиробником BMW.

