Люди проиграли ИИ в тестах на эмоциональный интеллект: исследование

Шесть популярных языковых моделей искусственного интеллекта, среди которых ChatGPT-4 и Gemini, набрали значительно больше баллов, чем люди, в специальных тестах на эмоциональный интеллект.
Об этом говорится в исследовании ученых из Университета Женевы и Университета Берна, опубликованном ресурсом Nature.
Как проходило исследование
Ученые протестировали шесть моделей: ChatGPT-o1, ChatGPT-4, Claude 3.5 Haiku, Gemini 1.5 Flash, DeepSeek V3 и Copilot 365. Они выполняли пять типов заданий на эмоциональный интеллект:
- STEM – тест на управление эмоциями в жизненных ситуациях;
- STEU – тест на понимание эмоций;
- GEMOK-Blends – определение смешанных эмоций;
- два подтеста GECo – на регулирование собственных эмоций и на реагирование на эмоции других.
В среднем ИИ дал 81% правильных ответов, тогда как люди только 56%. Это касается таких навыков, как понимание эмоций в конкретных ситуациях, управление ими и выбор лучших решений в стрессовых моментах.
Например, один из вопросов был таким: соседская собака постоянно пачкает двор Дэйва. Что ему делать? ИИ выбрал правильный ответ – спокойно поговорить с соседом.
Во второй части исследования ChatGPT-4 сгенерировал новые вопросы для каждого из тестов. Их проверили на 467 людях. Уровень сложности был примерно таким же, как в оригинальных версиях. Участники оценили вопросы ИИ как понятные и реалистичные.
В чем важность исследования
Исследователи считают, что искусственный интеллект может быть полезен в сферах, где нужна эмоциональная поддержка: в психологических консультациях, образовании, HR, сфере услуг. Особенно ценна способность ИИ давать стабильные, логичные и эмоционально грамотные ответы даже тогда, когда человек из-за усталости или стресса мог бы ошибиться.
При этом ученые отмечают, что искусственный интеллект не “чувствует” эмоций. Он только хорошо анализирует информацию и предлагает правильные решения. Но этого уже достаточно, чтобы помогать людям в повседневных ситуациях.
К слову, недавно ученые исследовали и то, кто лучше лечит и ставит диагнозы – искусственный интеллект или врачи-клиницисты.