Google оголосив про формування нової команди в межах своєї дослідницької лабораторії Google DeepMind. Очолить цей проєкт Тім Брукс, колишній керівник відеогенератора OpenAI Sora, який нещодавно приєднався до DeepMind. Як зазначив Брукс у своєму дописі на платформі X, команда займатиметься розробкою масштабних генеративних моделей, здатних імітувати фізичний світ.
Про це інформує Techcrunch.

Ці моделі стануть частиною ширшого проєкту DeepMind, метою якого є створення універсальних інструментів для симуляції реального світу. За словами Брукса, команда активно наймає фахівців, щоб досягти поставлених завдань.
Нова команда моделювання працюватиме у співпраці з іншими відділами Google, зокрема Gemini, Veo та Genie. Серія моделей Gemini відома завдяки своїм можливостям аналізу зображень і тексту, а Veo спеціалізується на генерації відео. Genie ж займається симуляцією 3D-світів і ігор у реальному часі.
Моделі, що розробляються, матимуть широкий спектр застосувань. Вони зможуть симулювати середовища для навчання роботів, планування для автономних агентів і створення інтерактивного контенту, такого як відеоігри.
Проблеми галузі: конкуренція та етичні виклики
Розробка моделей, що імітують світ, стає популярним напрямком серед стартапів і великих технологічних компаній. Такі компанії, як World Labs, Decart і Odyssey, уже працюють у цьому сегменті. Вони фокусуються на створенні інструментів для медіаіндустрії, а також на реалістичних симуляціях для тренування роботів.
Однак розвиток цієї сфери не обходиться без проблем. Однією з ключових є питання авторських прав, адже моделі часто тренуються на неліцензованих відео. Наприклад, Google використовує ролики з YouTube, посилаючись на умови використання платформи, але конкретні дані про навчальні матеріали не розголошуються.
Нові функції Gemini: підсумки новин на Google TV
Крім моделювання реального світу, Google інтегрує штучний інтелект у свою екосистему пристроїв. На виставці CES 2025 компанія представила функцію News Brief для телевізорів Google TV. Вона дозволяє користувачам отримувати підсумки новин дня, зібрані на основі даних з Інтернету та відео на YouTube.
Ця функція стала першим продуктом Google, спрямованим виключно на підсумовування новин за допомогою ШІ. Однак подібні технології стикаються з критикою через ризик “галюцинацій“, тобто помилок у формуванні контенту.
Майбутнє інтерактивного телебачення з Google
Google прагне зробити телевізори більш інтерактивними. Нові моделі обладнані датчиками для виявлення присутності користувачів у кімнаті. Завдяки Gemini користувачі зможуть здійснювати пошук фільмів, шоу та відео, використовуючи голосові команди. Крім того, ШІ допоможе створювати персоналізовані підсумки контенту.
Запуск нових функцій планується до кінця 2025 року, і це, ймовірно, стане важливим кроком у трансформації способу взаємодії з медіа.

