Команда NovaSky з лабораторії Sky Computing Lab Каліфорнійського університету в Берклі представила Sky-T1-32B-Preview — нову модель штучного інтелекту для міркувань. Вона здатна конкурувати з попередніми версіями OpenAI o1 за ключовими показниками.
Про це інформує Techcrunch.
Вона здатна конкурувати з попередніми версіями OpenAI o1 за ключовими показниками. Головною перевагою Sky-T1 є її відкритість: дослідники надали доступ до всього необхідного для відтворення моделі, включаючи набір даних та навчальний код.
Навчання Sky-T1 коштувало менш ніж 450 доларів — це значний прорив у порівнянні з попередніми моделями, вартість створення яких обчислювалася мільйонами. За словами команди, використання синтетичних даних стало одним із ключових чинників здешевлення процесу. Подібний підхід раніше використовувався компанією AI Writer для розробки моделі Palmyra X 004, яка коштувала 700 тисяч доларів.
Переваги моделей міркування
На відміну від традиційних систем штучного інтелекту, моделі міркування мають здатність перевіряти факти та уникати типових помилок. Хоча процес їхньої роботи займає більше часу, результати є точнішими. Це особливо важливо для задач у сфері фізики, математики та природничих наук.

Sky-T1 є прикладом інтеграції передових технологій: команда NovaSky використала іншу модель міркування, QwQ-32B-Preview від Alibaba, для створення навчальних даних.
Потім дані було оброблено за допомогою GPT-4o-mini, що дозволило досягти високої якості підготовки. Навчання Sky-T1 із 32 мільярдами параметрів тривало лише 19 годин із використанням стійки з восьми графічних процесорів Nvidia H100.
Sky-T1 демонструє чудові результати у складних тестах, зокрема у MATH500 — колекції математичних завдань високого рівня. Також модель перевершила попередню версію OpenAI o1 за оцінкою кодування LiveCodeBench. Водночас у тесті GPQA-Diamond, який охоплює питання з фізики, біології та хімії, Sky-T1 поки поступається OpenAI o1.
Команда NovaSky зазначає, що Sky-T1 — лише початок. У найближчому майбутньому OpenAI планує випустити нову, вдосконалену модель міркування o3, яка також підніме планку для галузі.
Плани NovaSky на майбутнє
Розробники Sky-T1 мають намір удосконалювати свої моделі та впроваджувати передові технології для підвищення точності й ефективності.
«Ми плануємо створювати більш економічні й продуктивні системи, які відповідатимуть потребам користувачів», — заявили у NovaSky.
Їхній проєкт символізує нову еру розвитку штучного інтелекту, де інновації стають доступнішими для всіх, відкриваючи можливості для подальшого прогресу в цій галузі.
Раніше редакція сайту AI360 писала про те, що OpenAI зробила декілька грандіозних проривів у ШІ завдяки o3. Попри побоювання, що прогрес у напрямку більш розумного ШІ сповільнюється, нова модель OpenAI o3, представлена нещодавно, привернула увагу індустрії, демонструючи видатні досягнення.

