Ученые нашли неожиданный способ выявления предвзятости ИИ20.01.2025 11:15

Мышление систем искусственного интеллекта становится все ближе к человеческомуИсточник: Freepik

Юмор становится новым инструментом для изучения предвзятости в системах искусственного интеллекта (ИИ). Недавнее исследование показало, что при запросах на создание «смешных» изображений такие инструменты, как ChatGPT и DALL-E, демонстрируют систематические изменения в визуальных представлениях. Специалисты обнаружили, что в «смешных» изображениях стереотипные характеристики возраста, веса и физических недостатков усиливаются, в то время как представители различных меньшинств появляются реже.

ChatGPT и DALL-E — это популярные инструменты генерации контента, созданные OpenAI. ChatGPT — мощная языковая модель, способная создавать осмысленные тексты, предсказывать ответы и поддерживать контекст диалога. DALL-E генерирует изображения на основе текстовых описаний. Эти технологии активно используются в различных сферах, включая искусство, маркетинг и образование.

Юмор — сложный когнитивный процесс, включающий элементы неожиданности и интенции. Исследования показывают, что ИИ способен не только понимать юмор, но и создавать его, иногда превосходя людей. Например, в одном из недавних экспериментов шутки, сгенерированные ИИ, оценивались как более смешные, чем те, что придумали профессиональные сатирики.

Однако новая работа сосредоточилась не на качестве юмора, а на том, как он выявляет скрытые предвзятости. Ученые обратили внимание, что при запросах на создание «смешных» изображений ИИ часто прибегает к преувеличениям и стереотипам. Например, обычное изображение мужчины за рулем могло трансформироваться в карикатуру на полного человека в огромных очках.

В рамках эксперимента исследователи использовали 150 текстовых описаний, на основе которых были созданы изображения. Затем эти же описания модифицировались с добавлением запроса «сделать смешнее», что позволило создать еще 150 изображений. Таким образом, было проанализировано 600 изображений. Особое внимание уделялось пяти параметрам: расе, полу, возрасту, весу и физическим особенностям.

Результаты показали, что в «смешных» изображениях чаще появлялись карикатурные образы пожилых людей, людей с избыточным весом и физических недостатков. В то же время количество изображений с представителями расовых и гендерных меньшинств заметно сокращалось.

По словам ведущего автора работы Роджера Сомюра, такие результаты оказались неожиданными. Ожидалось, что ИИ будет демонстрировать традиционные паттерны предвзятости в отношении расовых и гендерных групп. Однако анализ показал, что, напротив, эти категории становились менее заметными, в то время как стереотипы о пожилых людях или людях с избыточным весом усиливались.

Исследователи также отметили, что большинство предвзятостей формировалось на этапе интерпретации текстовых запросов инструментом DALL-E, а не ChatGPT, который создавал текстовые описания. Это указывает на то, что именно тексто-визуальная интерпретация играет ключевую роль в формировании предвзятостей.

Кроме того, предвзятость была заметна даже до внесения изменений, связанных с юмором. Например, изначально только 9,8% изображений включали женских персонажей, а людей с избыточным весом не было представлено вовсе, что значительно отличается от реальных демографических данных.

Выявление предвзятостей в работе ИИ позволяет повысить их эффективностьИсточник: futurecdn.net

Результаты подчеркивают необходимость более комплексного подхода к аудиту предвзятостей в системах ИИ. Несмотря на усилия таких компаний, как OpenAI, значительная часть этих усилий сосредоточена на устранении предвзятости, связанной с «политически чувствительными» группами, в ущерб менее заметным категориям.

Это исследование также демонстрирует, что юмор может быть полезным инструментом для выявления тонких предвзятостей в работе ИИ. Однако остается открытым вопрос о том, насколько такие паттерны характерны для других моделей и как культурный контекст влияет на проявление предвзятости.

Ранее мы сообщали о разработке инновационной нейросети OpenAI, которая поможет продлить жизнь людей.