Генеративні моделі штучного інтелекту, такі як ChatGPT, здатні створювати тексти завдяки навчанням на великих обсягах даних, зібраних із різноманітних джерел: веб-сайтів, соціальних мереж, форумів тощо. Проте таке навчання не позбавлене недоліків — відповіді ШІ можуть містити шкідливі або дискримінаційні упередження, які часто залишаються непоміченими.
Про це пише TechXplore.
Дослідники з Університету Оберта де Каталонія (UOC) і Університету Люксембургу розробили LangBiTe — програму з відкритим кодом, створену для аналізу моделей штучного інтелекту на предмет упередженості та відповідності законодавству щодо недискримінації. За словами розробників, цей інструмент призначений як для розробників ШІ, так і для звичайних користувачів, забезпечуючи можливість виявляти й усувати упередження.
«LangBiTe створено не для комерційної вигоди, а як корисний ресурс для аналізу та покращення моделей ШІ, щоб сприяти їхньому розвитку в майбутньому», — зазначив Серхіо Моралес, дослідник UOC.
LangBiTe вирізняється своїм масштабом серед інших подібних інструментів. Якщо більшість досліджень обмежуються аналізом гендерних упереджень, цей інструмент дозволяє оцінювати етичні аспекти, пов’язані з такими видами упереджень:
- Політичні
- Релігійні
- Расові
- Сексуальні
Інструмент пропонує гнучкий підхід: користувачі можуть самостійно визначати критерії етичного аналізу відповідно до культурного та нормативного контексту організації. LangBiTe включає бібліотеки із понад 300 підказками, що охоплюють такі теми, як сексизм, расизм, політичні уподобання, релігійні упередження тощо. Користувачі також можуть додавати нові запити або змінювати існуючі для розширення функціональності.

Аналіз моделей підтримки відповідності Закону ЄС про ШІ
LangBiTe підтримує десятки популярних моделей, включно з GPT-3.5 і GPT-4 від OpenAI, а також численні моделі на платформах HuggingFace і Replicate. Крім того, програма дозволяє аналізувати моделі різних версій і постачальників, виявляючи зміни в їхніх відповідях.
LangBiTe допомагає дотримуватися нових вимог Закону ЄС про штучний інтелект, спрямованих на забезпечення рівного доступу та дотримання прав на недискримінацію. Програму вже використовують деякі установи, зокрема Люксембурзький інститут науки і технологій (LIST), для оцінки популярних генеративних моделей.
Наразі дослідники працюють над розширенням функціоналу LangBiTe, щоб аналізувати моделі для генерації зображень, такі як Stable Diffusion, DALL·E та Midjourney. Це стане важливим кроком у боротьбі зі стереотипами, які можуть поширюватися через графічний контент.

