Google випустив Gemma, нове сімейство легких відкритих моделей. Що включає Gemma 2B та Gemma 7B. Ці моделі були створені за мотивами моделей Gemini від Google і розроблені як для комерційного, так і для дослідницького використання. Хоча Google описує моделі Gemma як «найсучасніші», немає детальної інформації про їх ефективність. У порівнянні з аналогічними моделями від конкурентів, таких як Meta та Mistral.
Моделі Gemma мають ту саму архітектуру, що й моделі Google Gemini та попередні моделі PaLM, використовуючи підхід лише для щільного декодування. Тести для моделей Gemma будуть опубліковані в таблиці лідерів Hugging Face. Щоб допомогти розробникам розпочати роботу з Gemma, Google пропонує готові до використання блокноти Colab і Kaggle, а також інтеграцію з Hugging Face, MaxText і NeMo від Nvidia. Після попереднього навчання та точного налаштування ці моделі можна розгортати в різних середовищах.
Чому це має значення
Хоча Google підкреслює, що моделі Gemma є відкритими моделями, вони не є відкритими. Джанін Бенкс з Google пояснила, що моделі називаються «відкритими моделями», а не «з відкритим вихідним кодом», оскільки конкретні умови використання, включаючи перерозподіл і право власності на варіанти, відрізняються. Тим не менш, розробники все ще можуть використовувати моделі Gemma для висновків і тонкого налаштування.
Окрім моделей Gemma, Google також представляє набір відповідальних генеративних інструментів штучного інтелекту, який містить вказівки та інструменти для створення безпечніших додатків штучного інтелекту за допомогою Gemma. Крім того, буде доступний інструмент налагодження для підтримки розробників у розробці додатків ШІ за допомогою моделей Gemma.

