Microsoft представила серію нових моделей штучного інтелекту у відкритому доступі. Компанія зробила ще один крок у розвитку лінійки «малих моделей» Phi. Найпотужніша з нових розробок, за результатами тестів, здатна конкурувати з о3-mini від OpenAI, зокрема в математичних завданнях. До складу нової серії увійшли моделі:
- Mini-Phi 4 Reasoning
- Phi 4 Reasoning
- Phi 4 Reasoning Plus
Усі вони орієнтовані на глибоке розуміння, обробку складних запитів і міркування, що потребують точності та перевірки фактів.
Про це інформує Techcrunch.
Microsoft зазначає, що ці моделі створені не лише для великих обчислювальних центрів, а й для використання на «крайових» пристроях. Смартфонах, планшетах, освітніх гаджетах та вбудованих системах. Вони оптимізовані для низьколатентного середовища, але при цьому демонструють продуктивність, яка часто властива набагато більшим мовним моделям.
Mini-Phi 4: компактна модель для освітніх потреб
Mini-Phi 4 Reasoning стала найменшою з представлених новинок. Вона була навчена на мільйоні синтетичних математичних задач, згенерованих за допомогою моделі R1 від китайського стартапу DeepSeek. Володіючи лише 3,8 мільярдами параметрів, ця модель орієнтована на сферу освіти та вбудовані навчальні системи. Завдяки компактному розміру вона добре підходить для застосування на пристроях із обмеженими ресурсами. І тим самим не втрачаючи здатності розв’язувати логічні завдання.
Microsoft наголошує, що попри невеликі розміри, модель демонструє пристойні результати в обробці завдань, які потребують розуміння контексту й точного міркування. Саме тому її вважають перспективною для інтеграції у освітні програми.
Phi 4 Reasoning: підхід на основі якісних даних та навчання на прикладах
Модель Phi 4 Reasoning з 14 мільярдами параметрів вважається основною у новій серії. Вона навчена на високоякісних інтернет-даних і демонстраціях, відібраних з використанням o3-mini від OpenAI. Завдяки цьому модель особливо ефективна у сферах, що потребують глибокого аналізу. Наприклад таких як:
- Математика
- Природничі науки
- Програмування
Саме комбінація масштабності й якісних навчальних даних дозволила досягти продуктивності, характерної для набагато більших мовних моделей.
Phi 4 Reasoning Plus: модифікована версія з підвищеною точністю
Phi 4 Reasoning Plus — це покращена версія раніше випущеної моделі Phi 4. Вона адаптована до задач міркування та демонструє підвищену точність у виконанні певних типів завдань. За результатами внутрішнього тестування Microsoft, модель підходить до рівня DeepSeek R1. А та в свою чергу в десятки разів більша за обсягом — 671 мільярд параметрів.
У бенчмарку OmniMath, що оцінює математичні здібності моделей, Phi 4 Reasoning Plus досягла результатів, порівнянних із o3-mini від OpenAI.
Доступність і призначення моделей
Усі моделі вже доступні для завантаження та тестування на платформі Hugging Face разом із детальними технічними звітами. Microsoft підкреслює, що їх нові моделі поєднують у собі розмір, ефективність і функціональність. Завдяки використанню сучасних технік дистиляції, навчання з підкріпленням і ретельно відібраних даних. Вони призначені для розробників, які прагнуть створювати швидкі та адаптивні додатки зі штучним інтелектом навіть на обмежених платформах.
Нещодавно редакція сайту AI360 писали про те, як дослідження Microsoft показало, що моделі ШІ провалюють роботу з кодом. Штучний інтелект від провідних компаній, таких як OpenAI, Anthropic та інших, дедалі частіше використовується для підтримки програмістів. За словами генерального директора Google Сундара Пічаї, вже чверть усього нового коду в компанії створюється за допомогою ШІ.
У свою чергу, керівник Meta Марк Цукерберг також активно просуває ідею масштабного впровадження генеративного ШІ для програмування. Ці ініціативи підкреслюють прагнення техгігантів автоматизувати складні інженерні завдання.

