Зловещая долина у нейросетей
Зловещая долина у нейросетей — известный феномен при попытке сгенерировать фотореалистичные картинки посредством ИИ, есть по состоянию на 2025 год.
Описание[править]
Человеческий разум принимает в себя данные в основном посредством визуального канала информации, так строится модель мира. Отсюда именно восприятие физических объектов в человеке весьма развито. И известно понятие зловещей долины, когда нечто, что очень похоже на привычный вид, но отличается мелкими деталями, вызывает беспокойство.
ИИ, которые пока что не имеют прямого доступа к камерам и прочим методам восприятия, а работают только с фотографиями, видео и картинками, не в состоянии понимать некие очевидные для человека момента. Поэтому при генерации они допускают ошибки, которые хорошо заметны, и указывают на то, что применяется ИИ.
В старых картинках таким признаком были пальцы и вообще конечности, которые ИИ любил изображать неправильно, так как воспринимал двухмерные картинки, на которых часть руки скрыта, а представления о трёхмерной руке у ИИ нетути совсем дык. Однако в значительной степени удалось это исправить, и научить генерировать руки.
В нынешних ИИ это зачастую лица людей, которые выглядят слишком кукольно и становится понятно, что это картинка. Пока что ИИ не в состоянии полноценно реализовать мимику человека, так чтобы она выглядела действительно натурально, хотя модели и постоянно улучшаются. Как вариант, очень ограниченный набор эмоций, голосов и внешних типажей, ведь нейронки как минимум на данный момент оперируют очень ограниченной вариативностью и любой человек, который смотрел или слушал достаточно нарисованных ИИ людей, сможет определить сабж.
В видео же в роли такого маркера выступает кривая физика, которую ИИ не понимает вовсе. Достаточно запросить надевание одежды или открытие двери автомобиля, или кидание предмета. Физика будет явно несуществующей, так легко понять, что перед нами видео, которое сгенерировано ИИ. Не помогает и тот факт, что ИИ очень любят определённые режиссёрские шаблоны, из-за чего узнаваемость характерной "нейронной" физики увеличивается в несколько раз.