Субота, 6 Червня, 2026
ГоловнаAIAmazon презентувала неймовірно точну голосову ШІ-модель
ГоловнаAIAmazon презентувала неймовірно точну голосову ШІ-модель

Amazon презентувала неймовірно точну голосову ШІ-модель

-

У відповідь на ривок OpenAI та Google у сфері голосового ШІ Amazon представила революційну модель Nova Sonic. Це генеративна система, що здатна нативно сприймати та відтворювати мовлення. Новинка вже отримала оцінку як одна з найбільш досконалих моделей для природного голосового спілкування. Тим самим значно випереджаючи за функціональністю застарілі версії Alexa та аналогічні рішення конкурентів.

Про це інформує Techcrunch.

На думку розробників, Nova Sonic створена спеціально для нового покоління взаємодії з голосовими помічниками. Де природність, гнучкість і точність стають ключовими параметрами голосових помічників. У тестах модель демонструє продуктивність, порівнювану з передовими системами OpenAI і Google. Особливо в завданнях розпізнавання мовлення, якості відповіді та швидкості реакції.

Голосова ШІ-модель від Amazon.

Nova Sonic: найшвидша і найекономічніша на ринку

Amazon робить Nova Sonic доступною через Bedrock. Власну платформу для розробки корпоративних ШІ-рішень. Впровадження двонаправленого потокового API дозволяє гнучко вбудовувати модель у програми різного рівня складності. Компанія також підкреслює, що Nova Sonic — «найекономічніше» рішення у своїй категорії. Її використання обійдеться приблизно на 80% дешевше, ніж застосування GPT-4o від OpenAI.

Ціноутворення Amazon є частиною стратегічного кроку. Компанія планує зробити голосовий ШІ доступним для більшої кількості розробників та бізнесів. Це дозволяє впроваджувати голосові інтерфейси у широкий спектр додатків. Від смарт-пристроїв до систем підтримки клієнтів і цифрових консультантів.

За словами Рохіта Прасада, старшого віце-президента Amazon і головного наукового співробітника AGI, Nova Sonic має складну архітектуру. Що дозволяє їй ефективно взаємодіяти з API, аналізувати дані в реальному часі та здійснювати дії через зовнішні сервіси. Вона базується на масштабних системах оркестрації, що раніше були використані в проєкті Alexa.

“Nova Sonic менш схильна до помилок розпізнавання мовлення, ніж інші голосові моделі штучного інтелекту”, – зазначив Рохіт Прасад, старший віце-президент Amazon.

Під час діалогу Nova Sonic демонструє чутливість до ритму мовлення — реагує лише після пауз та враховує перебивання. Крім того, система автоматично формує розшифровку сказаного. Тим самим відкриває широкі можливості для використання в аналітиці, транскрипції або навчальних програмах.

Вражаючі результати тестування

Модель відзначається високою точністю розпізнавання мовлення навіть у складних умовах. У багатомовному тесті Multilingual LibriSpeech Nova Sonic досягла середнього рівня помилки у словах (WER). Модель показала точність на рівні лише 4,2% для англійської, французької, італійської, німецької та іспанської мов. Це означає, що з кожних 100 слів лише чотири можуть бути інтерпретовані неправильно. Цей показник неодмінно вражає навіть у порівнянні з лідерами індустрії.

У ще одному тесті — Augmented Multi Party Interaction — модель перевершила GPT-4o від OpenAI майже на 47%. Тест проходив на точність розпізнавання під час багатоголосих розмов. Ще одним важливим досягненням є швидкість. Середня затримка відповіді Nova Sonic становить лише 1,09 секунди, що робить її швидшою за GPT-4o, який відповідає із затримкою 1,18 секунди.

Nova Sonic — це не окрема розробка, а елемент ширшої стратегії Amazon у галузі AGI (штучного загального інтелекту). За словами Прасада, компанія працює над побудовою ШІ-систем, здатних виконувати будь-яке завдання. А саме з яким може впоратись людина за комп’ютером. У перспективі Amazon планує впровадження багатомодальних моделей. Ці моделі розумітимуть не лише голос, а й зображення, відео та навіть фізичні сигнали із сенсорних пристроїв.

Новий підрозділ Amazon AGI, очолюваний Прасада, відіграє ключову роль у продуктовій стратегії компанії. Уже зараз Nova Sonic інтегрована в оновлену версію голосового помічника Alexa+. Також підрозділ використовується у тестуванні нової ШІ-моделі Nova Act, здатної керувати браузером. Це ще один крок до створення цифрового асистента, здатного діяти як повноцінний цифровий агент.

Раніше редакція сайту AI360 писали про те, що Amazon представила оновленого голосового помічника на основі для Alexa+. Нова Alexa+ використовує систему «незалежності від моделі», яка динамічно підбирає найкращу модель ШІ для кожного запиту користувача.

Коваль Влад
Коваль Влад
Поки ми живемо своїм життям, штучний інтелект поступово охоплює все нові його аспекти. Вже не секрет, що кожний новий пристрій, кожна нова технічна розробка від космічної галузі до побутової техніки має ШІ. Сьогодні твій особистий ШІ лежить у кишені у вигляді смартфона, аналізуючі твої дії, пересування, форму тексту. Завтра він буде давати тобі поради, як краще діяти, пересуватися, писати. Післязавтра він буде здатний стати твоїм незамінним помічником у прийнятті рішень.

Схожі публікації

Вам сподобається

situs slot
slot dana
slot777
slot gacor hari ini