Жёлтый фильтр ChatGPT
Жёлтый фильтр ChatGPT (он же piss filter, мексиканский фильтр, желтуха ИИ, эффект старой фотографии из бабушкиного комода) — вирусный и, как оказалось, крайне заразный артефакт, присущий графическим высерам нейросети DALL-E что встроена в ChatGPT. Является характерным признаком, по которому даже самый отсталый школьник может с вероятностью 99,9 % определить, что картинка была сгенерирована ленивым промптером за три с половиной секунды, а не нарисована голодающим художником за три с половиной доширака. Представляет собой навязчивый желтоватый или сепийный оттенок, покрывающий всё изображение, отчего даже самые футуристичные пейзажи выглядят так, будто их откопали на пыльном чердаке или пропустили через инстаграм-фильтры образца 2012 года.
Суть[править]
Анонимус внезапно обнаружил, что его запросы в ChatGPT на создание очередной вайфу в стиле аниме, мема с котом или эпического полотна «Ленин на сабвее в Урюпинске» стали выдавать результат, как будто предварительно окунутый в банку с, кхм, продуктами жизнедеятельности. Белый цвет перестал быть белым, превратившись в оттенок слоновой кости, выцветшей газеты или зубов заядлого курильщика. Синий стал грязновато-бирюзовым, а лица сгенерированных людей приобрели нездоровый, гепатитный румянец.
Поначалу хомячки не обращали внимания. Ну, фильтр и фильтр, экая невидаль, может, это такой artistic choice от самой нейросети. Но эпидемия разрасталась. Мемы, которые по своей природе должны были иметь стерильно-белый фон, пожелтели. Иллюстрации для детских книг стали выглядеть так, будто пережили потоп и нашествие тараканов. Даже сгенерированные логотипы для модных стартапов приобрели винтажный флёр, будто их разрабатывали не в OpenAI, а в подпольной артели 70-х годов.
И тут началось.
С одной стороны баррикад окопались борцы с AI-артом. Для них это стало настоящим подарком судьбы. Появился простой и понятный маркер, позволяющий моментально заклеймить любую картинку как нейрошлак.
— Смотрите, оно всё жёлтое! Это коллапс модели! Она сама себя сожрала и теперь может генерить только в цвете мочи! Скоро вообще разучится рисовать!
— Комментарий под любой картинкой с желтизной
С другой стороны оказались сами пользователи нейросетей, которые немедленно расслоились на несколько враждующих каст. Самая многочисленная группа — казуалы-пофигисты. Они либо не замечают желтизны, либо им на неё глубоко плевать. Их девиз: «Работает — и ладно». Именно они ответственны за 95 % жёлтого контента в сети, постя его в свои уютные бложики, делая из этого аватарки и иллюстрируя свои гениальные бизнес-презентации, не парясь о таких мелочах, как цветовая температура. Далее идут страдальцы-неумехи. Эти желтизну видят, она их бесит, но что с ней делать — они не знают. Они вступают в неравный бой с машиной, добавляя в промпт заклинания вроде «без жёлтого фильтра», «убери сепию», «сделай белый фон БЕЛЫМ, СУКА». Иногда это даже помогает, но чаще всего нейросеть либо игнорирует мольбы, либо впадает в другую крайность. Их страдания на форумах и в чатах доставляют неимоверно. И, наконец, на вершине пищевой цепи расположились просветлённые Кельвинисты. Элита. Каста избранных. Те, кто познал дзен и знает, что с машиной нужно говорить на её языке. Они не просят и не умоляют. Они приказывают. Одним-единственным параметром — «color temperature 6500K» — они возвращают картинке девственно-чистые цвета, после чего свысока поглядывают на копошащихся внизу профанов. Для них жёлтый фильтр — это своего рода фейсконтроль, отсеивающий быдло от тех, кто действительно умеет в нейросети.
Почему оно такое?[править]
Версия для быдла[править]
Это самая любимая версия нейрохейтеров и просто недалёких людей. Звучит она грозно и апокалиптично: искусственный интеллект начал пожирать сам себя! Логика такая: люди массово генерировали картинки в тёплых тонах (например, в стиле Гибли), эти картинки попадали в интернет, нейросеть на них переобучалась, видела, что людям нравится тёпленькое, и начинала добавлять желтизны ещё больше. И так по кругу, пока всё не превратилось в одну сплошную сепию. Это, мол, и есть коллапс модели — вырождение, потеря информации, энтропия.
Звучит красиво, но, скорее всего, это чушь. Во-первых, модели уровня DALL-E 3 обучаются на гигантских, тщательно отфильтрованных датасетах, и доля недавних генераций в них ничтожно мала, чтобы так быстро и так кардинально повлиять на всю модель. Во-вторых, этот «дефект» появился довольно резко, с одним из обновлений, а не нарастал постепенно, как должно было бы быть при таком сценарии. В-третьих, другие модели, вроде Midjourney, которые тоже наверняка парсят интернет, подобной болезнью не страдают. Так что эту версию оставим для паникёров и любителей громких заголовков.
Версия для сочувствующих[править]
Более правдоподобная, но всё ещё неполная теория. Суть в том, что обучающий датасет ИИ сам по себе может быть предвзят. В нём может быть перекос в сторону определённых типов изображений. Огромная часть мирового визуального наследия, на котором обучаются сети, дошла до нас в пожелтевшем виде. Бумага желтеет, лак на картинах темнеет, цвета на старых плёнках выцветают. Нейросеть, будучи тупой машиной, не понимает, что это дефект времени. Она видит, что на миллионах картинок с тегом «красивый пейзаж» или «портрет женщины» небо не голубое, а желтоватое, а кожа не розовая, а цвета пергамента. И делает логичный для неё вывод: ага, значит, так и надо. Кроме того, фотографы и художники обожают снимать и рисовать во время восхода или заката, когда солнце низко над горизонтом и всё залито тёплым, золотистым светом. Эти работы считаются красивыми, получают высокие оценки и лайки. Нейросеть, анализируя эти данные, приходит к выводу, что тёплый, желтоватый свет — это признак качественного и одобряемого контента. И начинает по умолчанию применять его ко всему, от портрета Сталина до схемы устройства синхрофазотрона.
Эта версия объясняет наличие склонности к тёплым тонам, но не объясняет, почему эта склонность превратилась в навязчивый, всепроникающий фильтр, который появился так внезапно.
Версия для параноиков и циников (aka Истинная Версия)[править]
А теперь, анон, к самой мякотке. К тому, о чём не напишут в пресс-релизах OpenAI. Наиболее вероятная причина появления жёлтого фильтра — это не баг, а фича. Это было сделано намеренно. Зачем? А вот тут целый букет причин, одна другой краше.
— Это не баг, это фича!
— *старый девиз разработчиков, который снова актуален*
Самое очевидное — это невидимый водяной знак. Корпорации нужно как-то отличать контент, созданный их продуктом. Жёлтый фильтр — это гениально простой и в то же время эффективный watermark. Он не бросается в глаза так, как уродливый логотип в углу, но для тех, кто в теме, он служит безошибочным сигналом: сделано в ChatGPT. Это позволяет и отслеживать распространение контента, и отличать свои генерации от чужих. Далее, та самая проблема коллапса модели, которой так пугают хейтеры, реальна в долгосрочной перспективе. Если нейросеть будет обучаться на данных, которые сама же и сгенерировала, она действительно начнёт деградировать. Как этого избежать? Нужно уметь отличать свои картинки от человеческих при составлении новых датасетов. Жёлтый фильтр — идеальный маркер для автоматической фильтрации. Скрипт просто отбрасывает все картинки с характерным цветовым профилем, и вуаля — модель не ест свой собственный хвост. Третья, и, возможно, самая циничная причина — юридическое прикрытие (CYA — Cover Your Ass). В эпоху дипфейков и нейросетевой пропаганды вопрос ответственности стоит очень остро. Создавая изображения, которые по умолчанию имеют лёгкий, но заметный налёт нереальности, OpenAI как бы говорит: «Мы не пытаемся обмануть. Наши картинки — это не фотографии. Видите, они желтенькие!». Если какой-нибудь злоумышленник захочет создать фотореалистичный фейк, ему придётся приложить дополнительные усилия, чтобы убрать этот фильтр. А это уже можно списать на злой умысел пользователя. И, наконец, это может быть способ стимулирования «профессионализма». Оставляя по умолчанию слегка бракованный результат, OpenAI как бы намекает: «Хочешь лучше? Учись, развивайся, плати за подписку и читай документацию». Это создаёт искусственную элитарность и мотивирует пользователей не просто нажимать на кнопку, а вникать в процесс.
Война миров[править]
Как и любое значимое интернет-явление, piss filter немедленно стал полем для ожесточённых баталий. Священная война между противниками и сторонниками ИИ получила новый фронт.
Сторона «Против», назовём их желтушниками, восприняла артефакт с нескрываемым злорадством. Для них это было подтверждением всех их самых тёмных пророчеств. Любая дискуссия скатывалась к одним и тем же тезисам: «Ахаха, ваш хвалёный ИИ даже в цвета не может! Что дальше, начнёт рисовать шестью пальцами?»; «Это визуальный мусор, „слоп“, который загрязняет интернет. Теперь его хотя бы видно издалека»; «Я художник, я 10 лет учился колористике, а эта машина просто заливает всё мочой! И вы хотите, чтобы это заменило настоящее искусство?». Особую радость им доставляло то, что многие промптеры были слишком ленивы или глупы, чтобы убрать фильтр. Каждый жёлтый мем, каждая жёлтая аватарка становилась для них маленькой победой.
Сторона «За», кельвинисты (в честь той самой цветовой температуры в Кельвинах), отвечала с высоты своего технического превосходства.
— Алло, гараж! Это не баг, а дефолтная настройка. Я, как фотограф с 30-летним стажем, заявляю, что тёплая цветовая температура в 2000K имеет массу применений. Вы просто ничего не понимаете в искусстве.
— Ответ просветлённого на форуме, пытающегося оправдать кривой дефолт
Их аргументация сводилась к тому, что это не ошибка, а фича или настройка по умолчанию, которую легко исправить командой `color temperature 6500K`, и если ты этого не знаешь, то ты просто нуб. Некоторые даже утверждали, что это тонкая стилизация под винтаж, а другие признавались, что специально оставляют фильтр, чтобы позлить хейтеров. Этот конфликт обнажил глубокий разрыв не только между сторонниками и противниками ИИ, но и внутри самого ИИ-сообщества. Он чётко разделил тех, кто использует нейросеть как магическую кнопку «сделай мне красиво», и тех, кто пытается освоить её как инструмент.
Как лечить?[править]
Итак, допустим, ты, анонимус, не хочешь мириться с желтухой на своих шедеврах. Что делать? Путей несколько.
Первый — путь Кельвиниста. Это единственно верный способ получить предсказуемый результат внутри ChatGPT. Нужно указать точную цветовую температуру в Кельвинах, например, color temperature 6500K для нейтрального дневного света. Это требует минимальных знаний из области фотографии, что для среднего пользователя ChatGPT уже является непосильной задачей. Но именно этот метод используют те, кто в теме.
Второй — постобработка. Для тех, кто уже сгенерировал жёлтую картинку и только потом осознал свою ошибку. Берётся любой графический редактор, от Photoshop до GIMP, и в нём с помощью инструментов «Цветовой баланс» или «Кривые» желтизна убирается вручную. Проблема в том, что жёлтый фильтр часто «съедает» часть цветовой информации, и после его удаления цвета могут выглядеть блеклыми и вымытыми. Метод рабочий, но требует лишних телодвижений.
И последний — метод для ленивых предпринимателей. Как только проблема стала массовой, тут же появились умельцы, создавшие веб-сервисы, которые делают всё за тебя. Загружаешь жёлтую картинку, нажимаешь кнопку, скачиваешь исправленную. Некоторые из них даже пытаются брать за это деньги, что является верхом наглости.
В общем, спасение от желтухи есть, но оно, как всегда, требует либо знаний, либо дополнительных усилий. А поскольку 95 % пользователей нейросетей ленивы, жёлтый поток в интернете, похоже, не иссякнет никогда.
Ссылки[править]
- gpt-tone.com — тот самый сервис для ленивых, чтобы убрать желтуху в один клик.