OpenAI може незабаром випустити свого нового цифрового асистента, який підтримуватиме мультимодальний ШІ, що вміє навіть розпізнавати сарказм.
Про це повідомляє The Information.
Відповідно до джерел, OpenAI продемонструвала своїм клієнтам нову ШІ-модель, яка може не лише взаємодіяти з користувачем у діалозі, але й розпізнавати об’єкти. Існує можливість, що вона буде представлена 13 травня під час заходу, який розпочнеться о 21:00 за київським часом.
Нова модель забезпечує швидшу та точнішу інтерпретацію зображень та аудіо в порівнянні з існуючими ШІ-моделями для транскрипції або перетворення тексту на мову. За словами The Information, вона може допомогти працівникам служби підтримки клієнтів “краще розуміти інтонацію голосів тих, хто телефонує, або їх саркастичний тон”.
У теорії ця модель може допомогти студентам у вирішенні математичних завдань або перекладі складних термінів. За даними джерел ресурсу, нова ШІ-модель може випередити GPT-4 Turbo у “відповідях на деякі типи запитань”, але все ж може бути схильною до помилкових рішень.
Розробник Ананая Арора також повідомив, що OpenAI готується додати функцію телефонних дзвінків до чат-бота ChatGPT. Арора заявив, що виявив докази того, що OpenAI вже готується до використання серверів для аудіо- та відеозв’язку в реальному часі. Варто зауважити, що ця функція не буде доступна в моделі GPT-5, якщо її раптово випустять наступного тижня, оскільки голова компанії Сем Альтман спростував звіти про те, що майбутній захід матиме щось спільне з наступником ШІ-моделі GPT-4. Він також відхилив чутки про те, що компанія наступного тижня представить нову пошукову систему на основі ШІ.

