ШІ не розуміє людей: експеримент вчених виявив критичну слабкість нейромереж

Алгоритми виявилися абсолютно безпорадними перед людською мімікою

Дослідники з Корнелльського університету у США провели унікальне тестування сучасних мультимодальних ШІ-моделей (VLM), намагаючись навчити роботів соціального інтелекту. Експеримент показав, що ШІ чудово прогнозує фізичні катастрофи, однак категорично не здатний зчитувати емоції та міміку людей, які за цим спостерігають.

Про це пише РБК-Україна, посилаючись на дослідження науковців, опубліковане в ACM Digital Library.

Експеримент із хаосом: малюк, газонокосарка та гуманоїд

Мета науковців полягала у тому, щоб надати майбутнім домашнім та промисловим роботам здатність розуміти соціальні навички - зчитувати погляди, вгадувати наміри та передбачати потреби людей без слів.

Для цього вчені використали базу коротких напружених відеороликів. Серед сюжетів були:

малюк, який несе занадто повну чашку гарячої кави;
чоловік, що мчить на шаленій швидкості на газонокосарці;
робот-гуманоїд, який намагається перестрибнути між високими блоками.

Науковці протестували шість провідних моделей комп'ютерного зору та мови. Серед них були як гіганти із закритим кодом (OpenAI GPT-4o, Google Gemini 2.0 Flash), так і перспективні безкоштовні системи з відкритим кодом (зокрема DeepSeek).

Тестування проходило у два етапи:

Спочатку моделі аналізували безпосередньо самі дії на відео і намагалися вгадати, чим закінчиться сцена - успіхом чи аварією.

Потім ШІ показували відео або фотографії облич людей, які дивилися ці ж ролики, і просили зробити прогноз катастрофи суто за людською мімікою (на основі переляку, заплющених очей чи посмішки).

Читайте більше: ШІ навчився створювати вакцини проти COVID-19: що показали перші випробування на людях

Результати: емпатія програла математиці

Під час прямого аналізу відео ШІ показав виняткові результати.

Найкраща відкрита модель передбачила фінал із точністю 70%, а лідер серед закритих систем видав результат у 63% - це повністю відповідає або навіть перевищує рівень уважності середньостатистичної людини. ШІ легко зрозумів закони фізики та загрозу від ситуацій.

Проте як тільки завдання змінили й змусили моделі думати "через призму людей", система повністю зламалася.

Точність прогнозів, базованих лише на виразах облич очевидців, обвалилася до критичних 44,5-53,5%. Деякі потужні нейромережі взагалі почали видавати ідентичну стандартну відповідь для кожного обличчя, незалежно від того, чи була людина шокована, чи спокійна.

За словами провідної авторки дослідження Марії Терези Паррейри, результати якої офіційно презентували на Міжнародній конференції з взаємодії людей і роботів (HRI 2026) в Единбурзі, це свідчить про серйозний дефіцит соціального інтелекту у сучасного ШІ.

"Роботи не розуміють невербальних сигналів, які люди випромінюють під час контакту зі світом", - наголосила науковиця.

Чому роботам потрібно дозволити помилятися?

Професорка Корнелла Венді Джу вважає, що результати тестів вказують на глобальну помилку сучасної інженерії. Більшість лабораторій намагається роками тримати роботів у чотирьох стінах, прагнучи довести їх до вигаданого ідеалу, і лише згодом оприлюднює результати своїх досліджень.

"Коли вони нарешті випробовують їх у реальному житті, то завжди дивуються тому, як сильно контекст відрізняється від лабораторного і як непередбачувано реагують люди", - зазначила Венді Джу.

"Роботи повинні навчатися безпосередньо "на роботі" - працювати серед нас ще до того, як стануть ідеальними, "бачити" власні помилки, адаптуватися до людських емоцій та міняти свій софт у процесі живої взаємодії", - додала вона.

Наразі команда науковців планує з'ясувати точні причини "сліпоти" ШІ до людської міміки та змінити алгоритми навчання підказок для нейромереж.

Ще більше цікавого:

ШІ навчився працювати як людський мозок: смартфони та дрони отримають більше автономності
Секретний військовий ШІ випередив ChatGPT і Gemini: що вміє Fable 5

ШІ не розуміє людей: експеримент вчених виявив критичну слабкість нейромереж

Читайте також