У ввечері вівторка генеральний директор Google DeepMind Деміс Хассабіс викликав хвилю зацікавлення у спільноті розробників і геймерів. Відповідаючи на жартівливий допис користувача в X, який просив дати змогу «пограти у відеогру з моїх відео Veo 3», очільник DeepMind написав:
«Хіба це не було б щось».
Про це у своїй статті розповідає прес-служба Techcrunch.
Наступного ранку Логан Кілпатрік — один із провідних інженерів Google, що працює над AI Studio та API для моделі Gemini — відповів кількома емодзі 🤐. Тим самим ще більше підігрівши інтерес аудиторії. Хоча офіційний представник Google заявив виданню TechCrunch, що компанія поки не має чим поділитися. Все ж таки експерти не виключають, що ці сигнали, це перші натяки на подальший прорив у сфері генеративних технологій для відеоігор.
На відміну від генеративних моделей, які створюють реалістичне відео, «моделі світу» — це складніша технологія. Вони моделюють не просто візуальну сцену, а й симулюють логіку та динаміку середовища. Тим самим дозволяючи агентам прогнозувати реакції світу на їхні дії. Саме це відкриває двері до створення повноцінних інтерактивних симуляцій.
Veo 3 наразі є високоякісною моделлю генерації відео й аудіо. Вона дозволяє створювати кінематографічні сцени, включно з озвученням і саундтреками. Проте її вихід поки що залишається пасивним — вона не створює ігровий світ, у якому можна активно взаємодіяти з середовищем у реальному часі.
Genie, Gemini та симуляція майбутнього
Натомість інші розробки Google уже готують фундамент для появи справжніх світових моделей. У грудні компанія DeepMind представила Genie 2. Це модель, яка здатна створювати практично нескінченну кількість варіантів ігрових середовищ. Паралельно Google працює над трансформацією своєї флагманської моделі Gemini 2.5 Pro у мультимодальну модель світу, яка, за словами компанії, має імітувати принципи роботи людського мозку.
У січні цього року також стало відомо про формування окремої команди, що займатиметься саме розробкою таких моделей для симуляції реального середовища. Цей напрямок дає Google потенціал стати одним з лідерів на ринку генерації ігрового контенту.
Гонка за майбутнє: конкуренти пильнують
На ринку вже працюють інші гравці, які досліджують подібні напрями. Серед них — стартап World Labs, заснований піонеркою ШІ Фей-Фей Лі. Їхня система вже створює 3D-сцени на основі одного зображення, що нагадують ігрові простори. У цій же галузі активно розвиваються компанії Scenario, Runway, Pika, а також Microsoft і OpenAI з їхньою відеомоделлю Sora.
Однак Google має кілька суттєвих переваг: фінансові ресурси, потужну інфраструктуру та глобальну дистрибуцію. Якщо компанія об’єднає можливості Veo та Genie в єдиний гібридний інструмент, вона зможе серйозно змінити індустрію відеоігор. При тому не лише візуально, а й за глибиною інтерактивної симуляції.
Хоча Veo 3 ще не є моделлю світу, вона вже може використовуватися для створення трейлерів, кат-сцен та наративних прототипів. Але щоб говорити про повноцінні відеоігри, потрібно перейти до симуляцій, що реагують на дії користувача у реальному часі.
Саме в цьому — ключовий виклик для всієї галузі. Створення керованих, послідовних та активних середовищ вимагає нових архітектур ШІ. І якщо Google вирішить зробити ставку на цей напрямок, конкуренції на ринку стане ще більше — і вона буде жорсткішою.

