Шість популярних мовних моделей штучного інтелекту, серед яких ChatGPT-4 і Gemini, набрали значно більше балів, ніж люди, у спеціальних тестах на емоційний інтелект.
Про це йдеться у дослідженні вчених з Університету Женеви та Університету Берна, опублікованому ресурсом Nature.
Як проходило дослідження
Вчені протестували шість моделей: ChatGPT-o1, ChatGPT-4, Claude 3.5 Haiku, Gemini 1.5 Flash, DeepSeek V3 і Copilot 365. Вони виконували п’ять типів завдань на емоційний інтелект:
- STEM – тест на управління емоціями в життєвих ситуаціях;
- STEU – тест на розуміння емоцій;
- GEMOK-Blends – визначення змішаних емоцій;
- два підтести GECo – на регуляцію власних емоцій і на реагування на емоції інших.
У середньому ШІ дав 81% правильних відповідей, тоді як люди лише 56%. Це стосується таких навичок, як розуміння емоцій у конкретних ситуаціях, управління ними та вибір найкращих рішень у стресових моментах.
Для прикладу, одне з питань було таким: сусідський собака постійно бруднить подвір’я Дейва. Що йому робити? ШІ обрав правильну відповідь – спокійно поговорити з сусідом.
У другій частині дослідження ChatGPT-4 згенерував нові запитання для кожного з тестів. Їх перевірили на 467 людях. Рівень складності був приблизно таким же, як в оригінальних версіях. Учасники оцінили запитання ШІ як зрозумілі й реалістичні.
Чим важливе дослідження
Дослідники вважають, що штучний інтелект може бути корисним у сферах, де потрібна емоційна підтримка: у психологічних консультаціях, освіті, HR, сфері послуг. Особливо цінною є здатність ШІ давати стабільні, логічні та емоційно грамотні відповіді навіть тоді, коли людина через втому чи стрес могла б помилитися.
Водночас вчені наголошують, що штучний інтелект не “відчуває” емоцій. Він лише добре аналізує інформацію і пропонує правильні рішення. Але цього вже достатньо, щоб допомагати людям у повсякденних ситуаціях.
До слова, нещодавно науковці дослідили й те, хто краще лікує і встановлює діагнози – штучний інтелект чи лікарі-клініцисти.