Генеральний директор OpenAI Сем Альтман ще на початку року заявив, що 2025-й стане важливим для розвитку агентів штучного інтелекту. Інструментів, які можуть автоматизувати процеси та виконувати завдання замість користувачів. І от тепер компанія робить перший реальний крок у цьому напрямку.
Про це інформує Techcrunch.
OpenAI оголосила про запуск дослідницької версії Operator – ШІ-агента загального призначення, здатного керувати веб-браузером і самостійно виконувати певні дії. Спочатку Operator буде доступний лише для користувачів у США з тарифним планом ChatGPT Pro за $200, але компанія планує розширити доступ для користувачів рівнів Plus, Team і Enterprise. Сем Альтман зазначив, що запуск у Європі займе більше часу.
Функціональність і принцип роботи Operator
Operator працює на основі моделі Computer-Using Agent (CUA), яка поєднує можливості GPT-4o з вдосконаленими навичками міркування. Це дозволяє йому взаємодіяти з веб-інтерфейсами без необхідності використовувати API, орієнтовані на розробників. Іншими словами, він може натискати кнопки, заповнювати форми та переміщатися меню, як людина.
Користувачі ChatGPT, активуючи Operator, отримують доступ до спеціального вікна, у якому показано дії агента та його пояснення. Оператор може виконувати такі завдання, як бронювання квитків, замовлення їжі та покупка товарів в інтернеті. Під час роботи ШІ-агента користувачі все ще мають контроль над екраном, а сам Operator використовує окремий веб-браузер.

Щоб уникнути помилок, OpenAI навчила CUA запитувати підтвердження користувача перед виконанням важливих завдань, таких як відправлення замовлення чи електронного листа. Це дозволяє людям перевірити всі дії перед їх виконанням.
Обмеження та виклики безпеки
Попри потужні можливості, OpenAI визнає, що Operator поки не може надійно виконувати складні або спеціалізовані завдання, наприклад створення презентацій чи управління складними календарями. Також існують певні обмеження, зокрема ліміти швидкості та загальний денний ліміт використання.
Operator не виконує завдання, пов’язані з банківськими транзакціями, і вимагає активного нагляду під час роботи з чутливими веб-сайтами, такими як електронна пошта. Крім того, він може «застрягати» при взаємодії зі складними інтерфейсами або системами CAPTCHA. OpenAI приділяє особливу увагу безпеці, запобігаючи використанню агента для зловмисних цілей, таких як автоматизація шахрайських схем або DDoS-атаки. Компанія впровадила інструменти для моніторингу активності Operator та призупинення його роботи в разі виявлення підозрілих дій.
Майбутнє ШІ-агентів
Запуск Operator демонструє прагнення OpenAI створити повноцінного ШІ-агента, який зможе виконувати дії в інтернеті замість користувача. Хоча компанія просувається обережно, враховуючи ризики, цей крок знаменує новий етап у розвитку штучного інтелекту. OpenAI нещодавно представила Tasks – функцію для автоматизації простих завдань у ChatGPT, що наблизило його можливості до голосових помічників, таких як Siri та Alexa. Проте Operator виходить за межі традиційних віртуальних асистентів, надаючи користувачам значно ширші можливості.
Агенти ШІ можуть змінити підхід до взаємодії з інтернетом, дозволяючи не просто отримувати інформацію, а й активно виконувати дії. OpenAI прагне стати лідером у цій сфері, і Operator може стати першим кроком до майбутнього, де ШІ допомагає людям у повсякденних завданнях.
Нещодавно редакція сайту AI360 писали про те, що компанія OpenAI оголосила про створення спільного підприємства Stargate Project у партнерстві з японським конгломератом SoftBank, корпорацією Oracle та іншими великими гравцями. Головною метою проекту є розробка та будівництво інфраструктури центрів обробки даних для штучного інтелекту у США.

