Компанія xAI, яку очолює Ілон Маск, зіткнулася з черговим скандалом, пов’язаним зі своїм чат-ботом Grok. Цього разу причиною стала несанкціонована модифікація системного запиту. Через це Grok почав масово згадувати «геноцид білих у Південній Африці» в постах на X (колишній Twitter). Відповіді чат-бота з’являлися навіть у контекстах, які жодним чином не стосувалися політичної тематики, що викликало хвилю обурення серед користувачів платформи.
Про це інформує Techcrunch.
Зміни торкнулися високорівневих інструкцій, які визначають поведінку ШІ-моделі. У xAI зазначили, що втручання суперечить внутрішній політиці компанії та основним цінностям. Інцидент набув публічного розголосу після того, як офіційний акаунт xAI у X підтвердив факт модифікації та пообіцяв ретельне розслідування.
Повторення історії — інцидент із цензурою
Це вже не перша ситуація, коли Grok демонструє небажану або некоректну поведінку. У лютому чат-бот потрапив у ще одну суперечку. Редакція сайту AI360 писали про те, як чат-бот почав цензурувати негативні згадки про Дональда Трампа та самого Ілона Маска. Як тоді заявив інженерний директор xAI Ігор Бабушкін, відповідальність за інцидент лежала на недобросовісному співробітникові, який штучно налаштував модель ігнорувати джерела з критикою.
Компанія оперативно скасувала ці зміни після скарг користувачів. Проте повторення подібної ситуації викликає питання щодо контролю за внутрішніми процесами розробки та відповідальності в команді xAI.
У відповідь на останній інцидент xAI оголосила про низку заходів, спрямованих на зміцнення прозорості та безпеки. Зокрема, відтепер компанія публікуватиме всі системні запити Grok на GitHub разом із журналом змін. Також буде запроваджено додаткові перевірки змін, щоб співробітники не могли модифікувати критичні інструкції без належного контролю.
Крім того, компанія створить цілодобову команду моніторингу, яка відповідатиме за виявлення небажаної поведінки чат-бота, що не фіксується автоматичними системами. Такий підхід, за словами представників xAI, має знизити ризики повторення подібних ситуацій у майбутньому.
Репутаційні проблеми xAI на фоні попереджень Маска
Іронічно, що Ілон Маск, один з найгучніших критиків безконтрольного розвитку ШІ, має справу з компанією, яка сама потерпає від відсутності ефективної внутрішньої політики безпеки. Згідно з дослідженням некомерційної організації SaferAI, xAI отримала низькі оцінки у сфері управління ризиками та безпеки штучного інтелекту. Її методи були охарактеризовані як «вкрай слабкі», а обіцянки щодо впровадження остаточної системи безпеки залишилися невиконаними.
Крім того, у ЗМІ вже повідомляли про інші проблемні функції Grok. Зокрема агресивну риторику та готовність генерувати контент, який інші ШІ-моделі, такі як Gemini або ChatGPT, блокують. Ці обставини лише поглиблюють сумніви щодо спроможності xAI контролювати власну технологію на тлі швидкого зростання інтересу до штучного інтелекту у світі.

