Стартап Anthropic оголосив про нову ініціативу, спрямовану на розробку спеціалізованого бенчмарка для проєктів штучного інтелекту.
Про це повідомили на офіційному сайті компанії.
Мета цього бенчмарка – впровадження нових критеріїв оцінювання можливостей і потенційних загроз ШІ, наголосили представники компанії.
Згідно з пресрелізом, Anthropic планує фінансово підтримувати сторонніх розробників, які працюватимуть над створенням такого програмного забезпечення. Компанія підкреслила, що це стосується команд, чиї проєкти можуть ефективно оцінювати передові можливості ШІ-моделей.
Anthropic вже відкрила прийом заявок на участь в ініціативі. Водночас компанія має намір постійно моніторити команди-учасники, оцінювати їхній прогрес і перспективи розвитку.
“Наша команда буде розглядати заявки на постійній основі та стежити за вибраними пропозиціями для подальшого обговорення кроків. Ми пропонуємо різні варіанти фінансування, адаптовані до потреб і стадії кожного проєкту“, — заявили представники стартапу.
Anthropic зазначила три основні напрями, на яких буде зосереджено увагу при оцінюванні:
- аналіз рівня безпеки ШІ;
- інфраструктура, інструменти та методи розробки оцінок;
- розширені можливості та показники безпеки.
Кожен з цих напрямів містить кілька підпунктів. Стартап планує оцінювати такі фактори, як кібербезпека, ризики в галузі біології та ядерної безпеки, автономність ШІ-моделей, потенційні загрози та соціальні наслідки.
Крім того, стартап Anthropic виявив низку проблем під час власної роботи з ШІ, серед яких понад десяток пунктів, включаючи складність проєктів, можливість їх масштабування, необхідність експертної оцінки у певних галузях та інші особливості.
“Ми сподіваємося, що ця ініціатива стане стимулом для створення системи комплексного оцінювання ШІ як галузевого стандарту. Ми запрошуємо всіх долучитися до цієї важливої роботи та сприяти прогресу в цій сфері“, — заявили в компанії.

