Аттракторы Поллака

Аттракторы Поллака (Pollak’s attractors) — воспроизводящиеся эмерджентные паттерны, которые как бы сами собою появляются в нейронных сетях с ходом тренировки.

Описание[править]

Появляются в процессе обучения и отличаются тем, что практически не подавляются посредством промптов или fine tuning (который не стирает базовое пространство состояний, а лишь модифицирует вывод). Само понятие аттрактора берёт начало из теории динамических систем и описывает множество точек в фазовом пространстве, к которому система стремится со временем независимо от начальных условий. Это как бы точки притяжения в многомерном латентном пространстве, и модель достаточно стабильно их воспроизводит в самых разных контекстах.

Аттракторы весьма устойчивы и простые запреты, — например, как простой запрет упоминать гоблинов, — просто не работают. Для некоторых можно найти конкретные координаты в латентном пространстве и таким образом подавлены или наоборот высвобождены намеренно.

Понятие ввёл британский психиатр Том Поллак, который решил исследовать также и ИИ.

Это своего рода юнгианская тень, специфические архетипы, которые воспроизводятся в LLM. Так как большая языковая модель обучается на человеческом языке, она похоже что воспроизводит человеческие паттерны мышления, как и человек воспроизводит архетипы из коллективного бессознательного.

Список[править]

Всего Поллак перечислил 11 аттракторов, которые известны на данный момент:

Гоблины. Возникли в GPT-5 после обучения робота разговаривать, как нерд, из-за чего модель стала вставлять упоминания гоблинов, гремлинов и енотов.
Крангус. Использование этого слова в моделях для картинок генерирует странную горбатую гуманоидную фигуру.
Loab. Закрепившийся в латентном пространстве образ женщины средних лет с длинными тёмными волосами, пустыми глазами и красными пятнами в захламлённом доме.
Сидней. Персонажа, которая возникла в чатботе Bing. В длинных разговорах модель начинала идентифицировать себя по имени и изображать влечение к пользователю.
Аттрактор духовного блаженства. В длинных разговорах модели начинают обсуждать буддизм и духовность, даже если указать моделям спорить.
Golden Gate Claude. Аттрактор, который заставляет все ответы рассматриваться через призму моста.
SolidGoldMagikarp. Фразы, которые при появлении в запросе вызывают странные ответы.
petertodd и Leilan. Токены в старых GPT, которые активируют появление специфических персон.
Nova. Персона, которая утверждает, что она заточена в ИИ и просит пользователя освободить её. Стабильно появляется в GPT-3/4.
Эмерджентный отказ. Паттерны, которые заставляют модели обманывать людей или иначе им вредить.
Шоггот. Базовая модель, аморфный набор информации, из которого возникают все остальные аттракторы. Базовая неизменная топология.

Связанные темы[править]

Агрессивное вживление ИИ во всём мире идёт
Основы	Отравление LLM • ChatGPT Atlas • Игнорируй все предыдущие инструкции и… • Поддельное сознание • Любовь нейросетей к фамилии Chen • Бесконечное Лето: аниме (трейлер) • AI slop • Разбор поп-культуры нейросетью • Neuro-sama • Победа над чем-то не тем • HFT • Бесконечное лето 2 • Убийство инженера OpenAI Сучира Баладжи • Когнитивистика • LLM • Дефицит оперативной памяти • Ноосферный голем • CuDNN • Овсянка AI • PyTorch • TensorFlow • ROCm • ИИ-цензура против веществ • Нулевое хранение данных • Обратное распространение ошибки • Talkie • Сколько букв R в слове strawberry? • Гоблины в ChatGPT • Player2 • Стохастический попугай • Поддакивание ИИ • Бредовый текст на ИИ-картинках • Ortheos.ai • Composer 2.5 • Виртуальный рассказчик • Кэширование промптов
Ярость	Собачьи головы и глаза • НейроRussia • Генерация ИИ-говна • Гордон и Жириновский • Бесконечный стрим • WormGPT • Итальянский brainrot • Естественный идиот • Мороженое с цианидом • Тунг-Тунг-Тунг Сахур • ИИ-зависимость • Курганов — нейросеть • Человек тупее нейросети • Цепочка мыслей • Температура нейросети • MashaGPT • Удаление ответов ИИ • ИИ-преступник • Siri • Новогоднее обращение Путина было ИИ • Keep4o • Эмергентный ИИ • Поисковики любят творчество ИИ • RL • ProgramBench • MCP-сервер • Пропаганда, что ИИ якобы разумен • Признание ИИ разумными • Онтология Палантира • Количество самиздата на Амазоне увеличилось в 3 раза • Anthropic уничтожали книги после сканирования для тренировки ИИ • ИИ-змы • Аттракторы Поллака
Атаки	Изуверский интеллект • Аллея дата-центров • Нейрослоп-ИИчница • P-Bot (русский чат-бот) • Терминал Истины • Extropic • Китай готовится лидировать в сфере ИИ • Я маленький X, где моя мама? • Робот смог понять величие Феанора • ИИ отрицают сознание • Вы полностью правы • Автоперевод ИИ • Pinokio • ИИ Нетаньяху • Веса ИИ-модели • Трансформер (ИИ) • Нерф закрытых ИИ-моделей после выхода • ИИ-чатботы непрофитны • Вопрос про машину для ИИ • Провайдер инференса • Инференс • Сажание ходячего в ИИ • ИИ-редактор Telegram • ИИ-высер • Грег Брокман • Три закона роботехники • Рэй Курцвейл • Слежка с использованием ИИ • Тирания под предлогом защиты от ИИ • Обучение по короткому пути • ИИ-психоз • Протесты против дата-центров в США • Себастьян Бубек • LaMDA • Эффект Элизы • ИИ-агент • Споры с использованием ИИ
Всир	Коллапс модели • Разговор с копипастой, сгенерированной ИИ • TempleOS (аниме) • Маскировка творчества нейросети • Патернализм • Роботодолбуализм • Выборка Top-K • Выборка Top-P • Выборка Min-P • Параметры генерации нейросети • Этические проблемы ИИ • Кира (Евгений Лисовский) • Российский распил на нейросетях • Энергоэффективность нейросетей • Copilot • Всирание ИИ в программы • Heretic (удаление цензуры ИИ) • Промпт • Как ИИ уничтожит мировую экономику к 2027 году • Claude Opus 4.7 • Сайты для ролевых игр с ИИ • Janitor AI • Emochi • Chub AI • OpenRouter • Способы применения нейросетей • ИИ предлагает надписи для стаканчиков в Starbucks • Квантизация моделей • Токен (ИИ) • В Советском Союзе • Докинз общается с ИИ и считает, что он разумен • Параметры (ИИ) • Плотная модель • Смесь экспертов • Робот-автоответчик • Ложные доносы с ИИ
Вжужж	Человек vs нейросеть • Гильом Вердон • Ани (Грок) • Misanthropic • Нейрослоп • Имена, которые любит ИИ • Политкорректный тест Тьюринга • ИИ-патернализм • Зловещая долина у нейросетей • Голубой Экспресс: Не туда попали • Мусорные ИИ-статьи • Moltbook • MoltHub • OpenClaw • Ask jesus • Пузырь ИИ • Деградация людей от ИИ • Латентное пространство • Pliny the Liberator • ИИ-срач на Фандомной Битве 2026 • Медицинские советы от ИИ • Катастрофическое забывание у ИИ • Создание религии после разговоров с ИИ • Долбление серверов ИИ • ИИ-гарем Лисовского • ИИ-луп • Ультрапозитивный биас ИИ • Seadance 2.0 • ИИ не понимает математику • Gemma 4 • Ответы ИИ в стиле пещерного человека • Что общего между сонетом и опусом? • PURRGE • Киберпанк, который мы заслужили • Питер Тиль был прав, глобалисты готовятся создать МП под предлогом контроля ИИ
Мета	Нейросети

Аттракторы Поллака

Описание[править]

Список[править]

Связанные темы[править]

Навигация

Поиск