Один із найвідоміших стартапів у сфері генеративного штучного інтелекту, Midjourney, офіційно запустив свою першу відеомодель на основі ШІ під назвою V1. Це стало важливою віхою у розвитку компанії, яка до цього часу здобула популярність завдяки генерації зображень. Модель V1 дозволяє перетворювати зображення у відеофрагменти. Користувач завантажує зображення — або створене у Midjourney, або будь-яке інше і на його основі система генерує чотири відео тривалістю по п’ять секунд.
Про це повідомляє Techcrunch.
Запуск нової функції став доступним лише через Discord, як і всі попередні інструменти компанії, але наразі виключно у вебверсії. Midjourney не лише пропонує новий продукт для своєї спільноти, а й фактично вступає у пряму конкуренцію з флагманами ринку. А саме з такими, як:
- Sora від OpenAI
- Gen-4 від Runway
- Firefly від Adobe
- Veo від Google
Проте стартап наголошує, що його амбіції виходять за межі комерційного відеоконтенту.
Фокус на відкриті світи та творчість
За словами генерального директора компанії Девіда Хольца, нова відеомодель — це лише початок на шляху до більш масштабної мети. А саме до створення моделей, здатних до реалістичних симуляцій у відкритому світі в режимі реального часу. У Midjourney не приховують, що планують найближчим часом перейти до розробки інструментів для 3D-візуалізації та навіть агентів, які працюватимуть у реальному часі.
Поява V1 підтверджує послідовність у баченнях компанії, яка завжди намагалася вирізнятись своєю орієнтацією на художників, дизайнерів і креаторів, а не лише бізнес-споживачів. Саме ця творча складова вже давно відділяє Midjourney від інших гравців ринку.
Попри творчий підхід, відеогенерація виявилася помітно дорожчою за звичайні зображення. За один відеозапит система списує у вісім разів більше ресурсів, ніж за зображення. Це означає, що підписники витрачатимуть щомісячну квоту значно швидше. Базовий план коштує $10 на місяць, у той час як план Pro ($60/місяць) та Mega ($120/місяць) дозволяють створювати відео в повільному режимі “Relax” без обмежень.
V1 також пропонує варіанти налаштування анімації. Користувачі можуть або дозволити системі автоматично визначати рух, або детально описати його вручну в тексті. Окрім того, є можливість змінювати інтенсивність руху об’єктів та камери — від «низького» до «високого».
Правові виклики та критика з боку кіноіндустрії
YНовина про запуск V1 з’явилася всього через кілька днів після того, як Disney та Universal подали позов проти Midjourney. Як раніше писала редакція сайту AI360, компанії звинувачують стартап у порушенні авторських прав через генерацію зображень, що відтворюють захищених персонажів — зокрема, Гомера Сімпсона та Дарта Вейдера. Це продовжує глобальну юридичну дискусію навколо тренування ШІ-моделей на матеріалах, захищених правом інтелектуальної власності.
Хоча Midjourney позиціонує себе як інструмент для творчих експериментів, уникаючи активної монетизації через рекламну чи розважальну індустрії, її не оминули правові претензії, які вже охопили багато інших компаній зі ШІ-сектору. Ризики, пов’язані з правами інтелектуальної власності, залишаються серйозною перешкодою для поширення подібних сервісів у масовому сегменті.
Попри певні обмеження, відео, створені за допомогою V1, можна подовжити з 5 до 21 секунди шляхом додаткової генерації. Демонстрації ранніх результатів показали, що стиль відео, як і у випадку з Midjourney-зображеннями, залишається скоріше сюрреалістичним і художнім, а не фотореалістичним. Утім, перші користувачі схвально оцінили якість генерації та потенціал платформи.
На тлі стрімкої конкуренції у сфері відеогенерації, новий продукт від Midjourney може стати справжнім подарунком для креативних спільнот, хоча остаточно оцінити його переваги зможемо лише після кількох місяців активного використання.

