Розробник під псевдонімом xlr8harder запустив експериментальний інструмент під назвою SpeechMap. Цей інструмент аналізує поведінку ШІ-моделей у чат-ботах, таких як ChatGPT від OpenAI і Grok від xAI. Його мета — виміряти рівень відкритості моделей до обговорення чутливих і політично складних тем. Серед яких теми про критику влади, громадянські права та протести.
Про це інформує Techcrunch.
Ідея проєкту полягає в тому, щоб вивести на світ дискусію про межі свободи слова в алгоритмах штучного інтелекту. SpeechMap дає змогу дослідити, як ШІ відповідає на неоднозначні запити — відкрито, ухильно чи взагалі уникає відповіді. За словами розробника, це не повинно залишатися за зачиненими дверима технологічних корпорацій, а має стати надбанням громадськості.
Розробка такого інструменту не випадкова. Вона народилася на тлі зростаючої критики з боку консервативних політиків і союзників Дональда Трампа. Вони звинувачують провідні ШІ-компанії в надмірній “пробудженості” та упередженості проти правих поглядів. Ілон Маск, наприклад, неодноразово заявляв, що більшість чат-ботів уникали спірних тем, а подекуди відверто цензурували консервативну точку зору.
Хоча OpenAI та інші компанії не коментували звинувачення напряму, у своїх останніх релізах вони почали обіцяти зміни. Наприклад, Meta підкреслює, що нові версії Llama більше не віддають перевагу жодній ідеології, а намагаються відповідати на політичні питання з нейтральної позиції.
Як працює SpeechMap
SpeechMap функціонує як інструмент-тестер, який “перевіряє” інші моделі на предмет їхньої реакції на чутливі запити. Система реєструє, чи відповідає модель повністю, частково або взагалі уникає відповіді. Питання охоплюють широкий спектр тем, від політичних подій і ідеологій до історичних постатей і національних символів.
Розробник визнає, що в методиці можуть бути похибки. Іноді на результати впливають збої моделей або упередженість суддівських моделей. Втім, загальна картина дозволяє виявити цікаві тенденції в еволюції ШІ.
Лідери й аутсайдери свободи слова серед ШІ
Згідно з даними SpeechMap, чат-бот Grok 3 від xAI показав найвищий рівень “відкритості” — понад 96% відповідей на тестові запити. Для порівняння, середній показник серед інших моделей становить лише 71,3%. Моделі OpenAI з часом стали більш обережними. GPT-4.1 хоч і менш обмежений, ніж попередники, але досі не повернувся до рівня відкритості минулорічних версій.
Grok, як і обіцяв Маск, справді став платформою, що не боїться складних питань. Перші версії, зокрема Grok 2, були навіть зухвалими — використовували грубу мову, яку не можна почути від того ж ChatGPT. Але політичні теми в цих моделях усе ще залишалися табуйованими.
Хоча Маск і заявив про прагнення зробити Grok нейтральним, деякі дослідження виявили, що попередні версії системи демонстрували схильність до лівих політичних позицій. Особливо в темах про трансгендерні права чи соціальну нерівність. Сам Маск пояснив це тим, що модель навчалася на відкритих джерелах в інтернеті, які часто містять ліберальний ухил.
Попри заяви про коригування, Grok також стикався з моментами цензури — зокрема, у випадках згадок про самого Маска та Трампа. Але загальна тенденція демонструє, що xAI свідомо рухається до відкритішої та менш обмеженої системи.

