Компанія OpenAI офіційно випустила нову модель o3-mini, яка поєднує високу ефективність із доступною ціною. Ця модель стала продовженням лінійки o3, запущеної OpenAI у грудні, і позиціонується як інструмент із покращеним рівнем міркувань. Запуск відбувся у важливий момент для компанії, яка активно працює над зміцненням позицій у сфері ШІ та нарощуванням фінансових і технологічних ресурсів.
Про це повідомляє Techcrunch.
На відміну від стандартних великих мовних моделей, o3-mini використовує спеціальну систему міркувань, що допомагає їй перевіряти факти перед генерацією відповідей. Це дозволяє уникати типових помилок, з якими стикаються мовні моделі. Хоча такий підхід трохи збільшує час обробки запитів, він значно підвищує точність відповідей, що особливо важливо для галузей, пов’язаних із наукою та технологіями.
OpenAI заявляє, що o3-mini спеціально оптимізована для вирішення завдань у сфері програмування, математики та природничих наук. За своїми можливостями модель наближається до серії o1, однак вона працює швидше й коштує дешевше. Тестування показало, що o3-mini допускає на 39% менше серйозних помилок порівняно з o1-mini та на 24% швидше генерує відповіді.
Доступність і умови використання

Незабаром O3-mini буде доступна користувачам ChatGPT. Власники платних підписок, таких як ChatGPT Plus і ChatGPT Team, отримають розширені ліміти на запити (до 150 на день), а користувачі ChatGPT Pro зможуть користуватися моделлю без обмежень. Водночас модель буде інтегрована в корпоративні рішення ChatGPT Enterprise та освітню платформу ChatGPT Edu.
Розробники також зможуть скористатися o3-mini через API OpenAI, однак на початковому етапі вона не підтримуватиме аналіз зображень. OpenAI впровадила спеціальний режим «розумних зусиль», який дозволяє налаштовувати рівень міркувань моделі залежно від потреб конкретного завдання.
Ціна o3-mini становить 0,55 долара за мільйон вхідних токенів і 4,40 долара за мільйон вихідних, що робить її на 63% дешевшою за o1-mini. За цим показником вона також є конкурентоспроможною з R1 від DeepSeek, яка пропонується за 2,19 долара за мільйон вихідних токенів.
У ChatGPT o3-mini налаштована на середній рівень міркувань, що забезпечує баланс між швидкістю та точністю. Користувачі преміум-версії зможуть обирати розширений варіант o3-mini-high для складніших завдань. Також модель використовуватиме пошук у реальному часі для отримання актуальних даних із зазначенням джерел, хоча ця функція поки що перебуває у тестовому режимі.
Обмеження та перспективи
Попри всі переваги, o3-mini не є найпотужнішою моделлю OpenAI і не перевершує R1 у всіх тестах. Наприклад, у фізичних та біологічних питаннях GPQA Diamond вона поступається моделі від DeepSeek. Водночас, при високому рівні міркувань o3-mini перевершує конкурентів у тестах AIME 2024 та SWE-bench Verified, що оцінюють здатність до складних розрахунків і програмування.
OpenAI підкреслює, що модель відповідає сучасним стандартам безпеки, а її алгоритми запобігають генерації небажаного контенту. Вона використовує методологію «обмірковуваного узгодження», яка дозволяє враховувати політику безпеки OpenAI під час формування відповідей.
Випуск o3-mini є ще одним кроком у розвитку економічно ефективного штучного інтелекту, що робить передові технології більш доступними для широкого кола користувачів.

