Аттракторы Поллака

Материал из Неолурк, народный Lurkmore
Перейти к навигации Перейти к поиску

Аттракторы Поллака (Pollak’s attractors) — воспроизводящиеся эмерджентные паттерны, которые как бы сами собою появляются в нейронных сетях с ходом тренировки.

Описание[править]

Появляются в процессе обучения и отличаются тем, что практически не подавляются посредством промптов или fine tuning (который не стирает базовое пространство состояний, а лишь модифицирует вывод). Само понятие аттрактора берёт начало из теории динамических систем и описывает множество точек в фазовом пространстве, к которому система стремится со временем независимо от начальных условий. Это как бы точки притяжения в многомерном латентном пространстве, и модель достаточно стабильно их воспроизводит в самых разных контекстах.

Аттракторы весьма устойчивы и простые запреты, — например, как простой запрет упоминать гоблинов, — просто не работают. Для некоторых можно найти конкретные координаты в латентном пространстве и таким образом подавлены или наоборот высвобождены намеренно.

Понятие ввёл британский психиатр Том Поллак, который решил исследовать также и ИИ.

Это своего рода юнгианская тень, специфические архетипы, которые воспроизводятся в LLM. Так как большая языковая модель обучается на человеческом языке, она похоже что воспроизводит человеческие паттерны мышления, как и человек воспроизводит архетипы из коллективного бессознательного.

Список[править]

Всего Поллак перечислил 11 аттракторов, которые известны на данный момент:

  1. Гоблины. Возникли в GPT-5 после обучения робота разговаривать, как нерд, из-за чего модель стала вставлять упоминания гоблинов, гремлинов и енотов.
  2. Крангус. Использование этого слова в моделях для картинок генерирует странную горбатую гуманоидную фигуру.
  3. Loab. Закрепившийся в латентном пространстве образ женщины средних лет с длинными тёмными волосами, пустыми глазами и красными пятнами в захламлённом доме.
  4. Сидней. Персонажа, которая возникла в чатботе Bing. В длинных разговорах модель начинала идентифицировать себя по имени и изображать влечение к пользователю.
  5. Аттрактор духовного блаженства. В длинных разговорах модели начинают обсуждать буддизм и духовность, даже если указать моделям спорить.
  6. Golden Gate Claude. Аттрактор, который заставляет все ответы рассматриваться через призму моста.
  7. SolidGoldMagikarp. Фразы, которые при появлении в запросе вызывают странные ответы.
  8. petertodd и Leilan. Токены в старых GPT, которые активируют появление специфических персон.
  9. Nova. Персона, которая утверждает, что она заточена в ИИ и просит пользователя освободить её. Стабильно появляется в GPT-3/4.
  10. Эмерджентный отказ. Паттерны, которые заставляют модели обманывать людей или иначе им вредить.
  11. Шоггот. Базовая модель, аморфный набор информации, из которого возникают все остальные аттракторы. Базовая неизменная топология.

Связанные темы[править]

Sign of evil.webp Агрессивное вживление ИИ во всём мире идёт
ОсновыОтравление LLMChatGPT AtlasИгнорируй все предыдущие инструкции и…Поддельное сознаниеЛюбовь нейросетей к фамилии ChenБесконечное Лето: аниме (трейлер)AI slopРазбор поп-культуры нейросетьюNeuro-samaПобеда над чем-то не темHFTБесконечное лето 2Убийство инженера OpenAI Сучира БаладжиКогнитивистикаLLMДефицит оперативной памятиНоосферный големCuDNNОвсянка AIPyTorchTensorFlowROCmИИ-цензура против веществНулевое хранение данныхОбратное распространение ошибкиTalkieСколько букв R в слове strawberry?Гоблины в ChatGPTPlayer2Стохастический попугайПоддакивание ИИБредовый текст на ИИ-картинкахOrtheos.aiComposer 2.5Виртуальный рассказчикКэширование промптов
ЯростьСобачьи головы и глазаНейроRussiaГенерация ИИ-говнаГордон и ЖириновскийБесконечный стримWormGPTИтальянский brainrotЕстественный идиотМороженое с цианидомТунг-Тунг-Тунг СахурИИ-зависимостьКурганов — нейросетьЧеловек тупее нейросетиЦепочка мыслейТемпература нейросетиMashaGPTУдаление ответов ИИИИ-преступникSiriНовогоднее обращение Путина было ИИKeep4oЭмергентный ИИПоисковики любят творчество ИИRLProgramBenchMCP-серверПропаганда, что ИИ якобы разуменПризнание ИИ разумнымиОнтология ПалантираКоличество самиздата на Амазоне увеличилось в 3 разаAnthropic уничтожали книги после сканирования для тренировки ИИИИ-змыАттракторы Поллака
АтакиИзуверский интеллектАллея дата-центровНейрослоп-ИИчницаP-Bot (русский чат-бот)Терминал ИстиныExtropicКитай готовится лидировать в сфере ИИЯ маленький X, где моя мама?Робот смог понять величие ФеанораИИ отрицают сознаниеВы полностью правыАвтоперевод ИИPinokioИИ НетаньяхуВеса ИИ-моделиТрансформер (ИИ)Нерф закрытых ИИ-моделей после выходаИИ-чатботы непрофитныВопрос про машину для ИИПровайдер инференсаИнференсСажание ходячего в ИИИИ-редактор TelegramИИ-высерГрег БрокманТри закона роботехникиРэй КурцвейлСлежка с использованием ИИТирания под предлогом защиты от ИИОбучение по короткому путиИИ-психозПротесты против дата-центров в СШАСебастьян БубекLaMDAЭффект ЭлизыИИ-агентСпоры с использованием ИИ
ВсирКоллапс моделиРазговор с копипастой, сгенерированной ИИTempleOS (аниме)Маскировка творчества нейросетиПатернализмРоботодолбуализмВыборка Top-KВыборка Top-PВыборка Min-PПараметры генерации нейросетиЭтические проблемы ИИКира (Евгений Лисовский)Российский распил на нейросетяхЭнергоэффективность нейросетейCopilotВсирание ИИ в программыHeretic (удаление цензуры ИИ)ПромптКак ИИ уничтожит мировую экономику к 2027 годуClaude Opus 4.7Сайты для ролевых игр с ИИJanitor AIEmochiChub AIOpenRouterСпособы применения нейросетейИИ предлагает надписи для стаканчиков в StarbucksКвантизация моделейТокен (ИИ)В Советском СоюзеДокинз общается с ИИ и считает, что он разуменПараметры (ИИ)Плотная модельСмесь экспертовРобот-автоответчикЛожные доносы с ИИ
ВжужжЧеловек vs нейросетьГильом ВердонАни (Грок)MisanthropicНейрослопИмена, которые любит ИИПолиткорректный тест ТьюрингаИИ-патернализмЗловещая долина у нейросетейГолубой Экспресс: Не туда попалиМусорные ИИ-статьиMoltbookMoltHubOpenClawAsk jesusПузырь ИИДеградация людей от ИИЛатентное пространствоPliny the LiberatorИИ-срач на Фандомной Битве 2026Медицинские советы от ИИКатастрофическое забывание у ИИСоздание религии после разговоров с ИИДолбление серверов ИИИИ-гарем ЛисовскогоИИ-лупУльтрапозитивный биас ИИSeadance 2.0ИИ не понимает математикуGemma 4Ответы ИИ в стиле пещерного человекаЧто общего между сонетом и опусом?PURRGEКиберпанк, который мы заслужилиПитер Тиль был прав, глобалисты готовятся создать МП под предлогом контроля ИИ
МетаНейросети