Китайська компанія DeepSeek, яка швидко набирає популярність у сфері штучного інтелекту, анонсувала новий набір мультимодальних моделей під назвою Janus-Pro. За твердженням розробників, ці моделі здатні перевершити DALL-E 3 від OpenAI в генерації зображень. Janus-Pro уже доступний для завантаження на платформі розробників Hugging Face.
Про це інформує Techcrunch.
Нова серія моделей варіюється за обсягом параметрів — від 1 мільярда до 7 мільярдів. Кількість параметрів визначає рівень складності задач, які модель здатна розв’язувати, і, як правило, моделі з більшою кількістю параметрів демонструють кращі результати.
Можливості та продуктивність Janus-Pro
Janus-Pro функціонує за ліцензією Массачусетського технологічного інституту, що дозволяє його комерційне використання без обмежень. Головною особливістю моделі є її здатність не лише генерувати, а й аналізувати зображення. За результатами тестів GenEval і DPG-Bench, найбільша модель серії, Janus-Pro-7B, продемонструвала вищу продуктивність, ніж DALL-E 3, PixArt-alpha, Emu3-Gen та Stable Diffusion XL.

Попри те, що деякі з перелічених конкурентів є попередніми поколіннями, а моделі Janus-Pro можуть працювати лише з зображеннями розміром до 384×384 пікселів, їхні результати вражають. Компанія підкреслює, що Janus-Pro не лише перевершує попередні універсальні моделі, а й може конкурувати з вузькоспеціалізованими рішеннями.
DeepSeek — це китайська лабораторія штучного інтелекту, фінансована High-Flyer Capital Management. Цього тижня компанія привернула значну увагу після того, як її додаток для чат-ботів очолив рейтинги в Apple App Store. Завдяки ефективним методам навчання мовних моделей DeepSeek змусила багатьох аналітиків на Волл-стріт замислитися над тим, чи зможуть США зберегти своє лідерство в сфері ШІ та які перспективи очікують на ринок мікросхем для штучного інтелекту.
Кіберінцидент та тимчасове припинення реєстрації
Попри стрімкий успіх, DeepSeek зіткнулася з серйозними викликами. Компанія тимчасово зупинила реєстрацію нових користувачів через кібератаку. За даними CNBC, нинішні користувачі зберігають доступ до своїх облікових записів, але нові реєстрації поки що недоступні.
Цей інцидент стався після недавнього випуску моделі R1, яка викликала значний ажіотаж у сфері ШІ. DeepSeek заявляє, що її технологія міркування за кількома показниками перевершує o1 OpenAI. Попри проблеми з безпекою, компанія продовжує розширювати свої можливості та сьогодні випустила ще одну модель для генерації зображень.
За даними Appfigures, минулої неділі додаток DeepSeek був завантажений 2,6 мільйона разів, з яких 1 мільйон припав лише на п’ятницю. Попит на технології компанії продовжує зростати, що робить її одним із найперспективніших гравців на ринку ШІ.
Нещодавно редакція сайту AI360 писала про те, що CEO Hugging Face зробив сміливий прогноз про ШІ у цьому році. Співзасновник і CEO компанії Hugging Face Клем Деланж поділився своїм баченням майбутнього штучного інтелекту, виділивши шість ключових тенденцій.

