Сучасні інструменти ШІ вміють коротко описувати вміст одного відео, однак втрачають ефективність, коли мова йде про великі обсяги даних. Компанія Samsung наголошує, що аналіз сотень або тисяч годин відеозаписів із різних джерел досі залишається проблемою. Особливо для охоронних компаній і маркетологів, які хочуть знаходити закономірності, тенденції або інциденти в безперервному відеопотоці.
Про це у своїй статті розповідає видання Techcrunch.
На цьому тлі американський стартап Memories.ai розробив технологію, яка здатна обробляти до 10 мільйонів годин відео з глибоким розумінням контексту. Рішення компанії орієнтоване на масштабну аналітику:
- Індексацію
- Сегментацію
- Пошук даних
- Агрегацію даних
І усе це знаходиться в межах єдиної системи.
Засновники з досвідом у Meta та $8 мільйонів інвестицій
Компанію заснували Шон Шен, колишній науковий співробітник Reality Labs у Meta, та інженер машинного навчання Енмін (Бен) Чжоу, який також працював у Meta. Вони переконані, що на ринку існує серйозний вакуум — більшість сучасних моделей не здатні ефективно працювати з відео тривалістю понад одну-дві години.
Ідея команди отримала потужну підтримку з боку інвесторів. Під час раунду початкового фінансування стартап залучив $8 мільйонів, хоча початково планував удвічі менше. Серед інвесторів такі бізнеси як:
- Susa Ventures
- Samsung Next
- Seedcamp
- Crane Ventures
- Fusion Fund
- Creator Ventures
Партнер Susa Ventures Міша Гордон-Роу підкреслив, що бачить у продукті потенціал для створення «власного візуального інтелекту» — тобто здатності моделі запам’ятовувати, аналізувати та узагальнювати величезні масиви відеоінформації.
Платформа Memories.ai працює на основі власного технологічного стека. Спочатку вона видаляє зайвий шум із відео та стискає його, зберігаючи лише важливу інформацію. Далі матеріал проходить через шар індексації, який забезпечує швидкий пошук за тегами або запитами природною мовою. Завершує обробку шар агрегації, що дозволяє формувати детальні звіти на основі зібраної інформації.
Компанія вже обслуговує два типи клієнтів — охоронні фірми та маркетингові агенції. Перші можуть виявляти небезпечні дії людей на записах із камер відеоспостереження, другі аналізувати тренди у відео, пов’язані з брендами в соцмережах, і створювати нові ролики за рекомендаціями ШІ.
Плани на майбутнє: особисті ШІ-асистенти, роботи й безпілотники
Наразі клієнти повинні завантажувати відеофайли вручну, однак команда планує розробити функцію спільних сховищ та автоматичної синхронізації даних. У перспективі користувачі зможуть ставити складні запити, наприклад:
«Покажи всіх людей, з якими я розмовляв минулого тижня»
За словами Шена, платформа може стати основою для нових типів інтерфейсів, включаючи ШІ-асистентів, які розумітимуть життєві події за допомогою фотографій чи розумних окулярів. Також технологія може бути використана для навчання гуманоїдних роботів або навігації безпілотних авто.
У команді Memories.ai наразі працює 15 осіб, а нові інвестиції будуть спрямовані на розширення штату та вдосконалення пошукових можливостей платформи.
Стартапу доводиться змагатися з низкою молодих компаній, зокрема mem0, Letta, TwelveLabs і навіть Google. Проте більшість конкурентів поки що або мають обмежену підтримку відео, або фокусуються на окремих сегментах. На думку Шена, ключова перевага Memories.ai — горизонтальність рішення: воно не прив’язане до конкретної моделі чи галузі, а може інтегруватися з різними відеоінструментами.

