Китайський технологічний гігант Tencent Holdings Ltd. анонсував нову модель штучного інтелекту Hunyuan Turbo S. Ця модель позиціонується як “модель зі швидким мисленням”. Головна відмінність цієї моделі від конкурентів, зокрема від DeepSeek-R1, полягає в здатності давати відповіді практично миттєво. Компанія заявляє, що модель може генерувати текст удвічі швидше, ніж попередні аналоги, а затримка першого слова зменшена на 44%.
Про це повідомляє Siliconangle.
Щоб утримати лідерські позиції, Tencent розробила унікальну архітектуру для Turbo S, поєднавши Hybrid-Mamba-Transformer. Це рішення мінімізує обчислювальні витрати та дозволяє зберігати контекст при обробці довгих текстів, що робить модель ефективнішою.
Новий підхід до архітектури ШІ
Hunyuan Turbo S використовує поєднання Hybrid-Mamba-Transformer і Mixture of Experts (MoE). Це дозволяє їй працювати швидше і точніше, зменшуючи затрати на навчання та використання. Архітектура Mamba ефективно обробляє довгі послідовності тексту, а Transformer-компонент допомагає розуміти контекст і будувати складні логічні ланцюжки. За словами Tencent, це перша успішна інтеграція Mamba в надвелику MoE-модель без втрати продуктивності.
Технологія Mixture of Experts (MoE) передбачає, що кілька ШІ-моделей працюють разом, спеціалізуючись на різних завданнях. Це значно зменшує навантаження на систему і збільшує точність відповіді в конкретних запитах.
Майбутні інтеграції та ринкова стратегія
Tencent планує зробити Hunyuan Turbo S основною моделлю для своїх майбутніх ШІ-рішень. Вона стане базою для генерації тексту, коду та інших творчих завдань.

Hunyuan Turbo S використовує поєднання Hybrid-Mamba-Transformer і Mixture of Experts (MoE), що даю моделі бути більш швидшою ніж модель DeepSeek R1.
Через активну конкуренцію в галузі, компанії доводиться знижувати витрати на навчання ШІ та оптимізувати розгортання моделей. Tencent, як і її конкуренти, намагається зменшити вартість послуг, зберігаючи при цьому високу якість роботи ШІ.
Turbo S має потенціал для інтеграції в екосистему сервісів Tencent, включаючи чат-боти, пошукові системи та бізнес-інструменти. Очікується, що в майбутньому компанія продовжить удосконалювати модель, додаючи нові функції та можливості для бізнес-користувачів.
Нещодавно редакція сайту AI360 писало про те, як глобальна хвиля заборон на DeepSeek викликає занепокоєння в світі ШІ. Китайська компанія DeepSeek, яка спеціалізується на розробці штучного інтелекту, зіткнулася з хвилею заборон по всьому світу. Державні органи та корпорації висловлюють занепокоєння щодо конфіденційності, етики та потенційних загроз, пов’язаних із використанням технологій компанії.

