Сімейство «відкритих» моделей штучного інтелекту Google, Gemma, зростає. Під час конференції Google I/O 2025 компанія представила Gemma 3n. Це модель, розроблена для «плавної» роботи на телефонах, ноутбуках і планшетах.
Про це у своїй статті розповідає Techcrunch.
За даними Google, Gemma 3n, доступна для попереднього перегляду і може обробляти аудіо, текст, зображення та відео. Моделі, достатньо ефективні для роботи офлайн та без потреби в хмарних обчисленнях. Додатки з офлайн використанням, останніми роками набули популярності у спільноті штучного інтелекту. Вони не тільки дешевші у використанні, ніж великі моделі, але й зберігають конфіденційність. Тим самим усуваючи необхідність передачі даних до віддаленого центру обробки даних.
Під час виступу на I/O менеджер з продуктів Gemma Гас Мартінс заявив, що продукт може працювати на пристроях з оперативною пам’яттю менше 2 ГБ.
«Gemma 3n має ту саму архітектуру, що й Gemini Nano , і розроблена для неймовірної продуктивності», – додав Гас Мартінс.
Нові моделі для медицини та інклюзії
Окрім Gemma 3n, Google випускає MedGemma в рамках своєї програми Health AI Developer Foundations. За словами компанії, MedGemma — це її найпотужніша відкрита модель для аналізу тексту та зображень, пов’язаних зі здоров’ям. MedGemma чудово працює в різних програмах для роботи з зображеннями та текстом, тому розробники можуть адаптувати моделі для власних програм для здоров’я.
Також на горизонті з’являється SignGemma, відкрита модель для перекладу жестової мови в розмовний текст. Google стверджує, що SignGemma дозволить розробникам створювати нові додатки та інтеграції для глухих та слабочуючих користувачів.
«SignGemma — це нове сімейство моделей, навчених перекладати мову жестів у розмовний текст, але найкраще вона працює з американською мовою жестів та англійською», — сказав Мартінс.
Це найпотужніша модель розуміння мови жестів з усіх, і компанія з нетерпінням чекає, коли спільноти глухих і слабочуючих візьмуть цю основу для використання слухових опаратів. Варто зазначити, що Gemma критикували за її нестандартні ліцензійні умови, які, за словами деяких розробників, зробили комерційне використання моделей ризикованим. Однак це не завадило розробникам завантажувати моделі Gemma десятки мільйонів разів разом.
Нещодавно редакція сайту AI360 у своїй статті розповідала про нову 3D-платформу для відеозв’язку з інтеграцією в Meet від Google. На конференції Google I/O 2025 компанія оголосила про ребрендинг Project Starline. Це корпоративна платформа для телеконференцій, яка використовує 3D-зображення. Також компанія наголосила про повторне зобов’язання запустити її цього року.

