Кінець 2024 року ознаменувався значними змінами у сфері штучного інтелекту. Попри побоювання, що прогрес у напрямку більш розумного ШІ сповільнюється, нова модель OpenAI o3, представлена нещодавно, привернула увагу індустрії, демонструючи видатні досягнення. Ця модель перевершила очікування за ключовими індикаторами продуктивності, відкривши нові горизонти для штучного інтелекту 2025 року.
Про це фіксує Venturebeat.
Нижче ми розглянемо п’ять ключових інновацій, які зробили o3 поворотним моментом у розвитку ШІ, а також один суттєвий виклик, який залишається невирішеним.
Прорив №1: Синтез програм для адаптації завдань
O3 здатна комбінувати вивчені під час навчання шаблони, алгоритми та методи, створюючи нові конфігурації. Завдяки функції «синтез програм» модель може розв’язувати завдання, з якими раніше не стикалася. Це включає складні задачі кодування чи логічні головоломки, які потребують виходу за рамки простого повторення раніше вивченої інформації.

За словами Франсуа Шолле, творця тесту ARC, який оцінює здатність моделі до адаптивного інтелекту, така функція є значним кроком уперед.
Шолле описує «синтез програм» як здатність рекомбінувати наявні знання подібно до того, як кухар створює нові страви з відомих інгредієнтів.
Прорив №2: Пошук програм за допомогою природної мови
O3 використовує так звані ланцюги думок (Chain of Thoughts, CoTs), які є покроковими інструкціями, що генеруються під час вирішення проблем. Цей процес нагадує людський підхід до розв’язання завдань: оцінка альтернативних стратегій і вибір найбільш перспективної. Наприклад, у завданнях математичного міркування модель здатна створювати кілька рішень і оцінювати їх.
Цей метод є важливим кроком вперед у порівнянні з конкурентами, такими як Anthropic і Google, які також використовують подібні підходи, але реалізація OpenAI встановлює нові стандарти.
Прорив №3: Використання моделі оцінювача
Інтегрована модель оцінювача в o3 дозволяє аналізувати різні шляхи розв’язання задач і обирати найкращий.

Ця функція забезпечує потужний механізм для складних багатокрокових проблем. Такий підхід наближає o3 до можливості «думати», а не просто видавати відповіді.
Прорив №4: Виконання власних програм

Унікальною особливістю o3 є її здатність виконувати створені нею ж ланцюги думок (CoT) як інструменти для адаптивного вирішення проблем.
Це дає змогу моделі застосовувати вже створені стратегії у нових завданнях, що значно покращує її ефективність. Зокрема, в середовищі конкурентного програмування o3 досягла рейтингу понад 2700, що відповідає рівню «Гросмейстер» у CodeForces.
Прорив №5: Глибокий пошук програм та найважливіший прорив у ШІ
O3 використовує метод глибокого пошуку, орієнтованого на навчання, для оцінки потенційних рішень. Цей підхід забезпечує модель високою точністю, але водночас вимагає значних людських і обчислювальних ресурсів. Франсуа Шолле застерігає, що надмірна залежність від експертних даних може обмежити масштабованість моделі та її адаптивність до реальних сценаріїв.
Попри всі досягнення, модель o3 стикається з серйозною проблемою — високими обчислювальними витратами. Використання мільйонів токенів для виконання одного завдання потребує значних ресурсів, що ускладнює її впровадження в комерційні та повсякденні проєкти. Експерти галузі підкреслюють, що вирішення цього питання є критично важливим для подальшого прогресу.
Погляд у майбутнє
Модель o3 від OpenAI стала значним проривом, який піднімає планку для штучного інтелекту. Її інновації в адаптивному мисленні, логічному аналізі та вирішенні проблем відкривають нові можливості, але водночас підкреслюють виклики масштабування та економічної ефективності.
Наступний крок — вирішення цих питань, що стане ключовим у визначенні майбутнього ШІ у 2025 році та наступні роки.

