Выборка Min-P

Материал из Неолурк, народный Lurkmore
Перейти к навигации Перейти к поиску

Выборка Min-P (Min P sampling, также minimum probability) — продвинутый параметр генерации текста в LLM. Он определяет минимальный порог вероятности относительно наиболее вероятного токена. Параметр используется для фильтрации маловероятных токенов при генерации текста, в которых с высокой вероятностью может находиться какой-то бред.

Описание[править]

При генерации каждого следующего токена языковая модель вычисляет распределение вероятностей по всему словарю. Для того, чтобы сформировать более качественное пространство выборки, модель определяет токен с максимальной вероятностью P_max, затем устанавливается порог P_threshold = Min P × P_max, и все токены с вероятностью ниже P_threshold исключаются из рассмотрения. Оставшиеся токены перенормализуются, и из них производится выбор.

Для каждой генерации Min P задаётся в определённых рамках:

  • 0.0 — отключает фильтрацию, все токены остаются доступными
  • 0.05 — делается мягкая фильтрация, большинство токенов остаются доступными
  • 0.1 — проводится умеренная фильтрация, сохраняется баланс, при котором текст остаётся оригинальным
  • 0.2-0.5 — внедряется строгая фильтрация, нейросеть всегда предпочитает самые вероятные варианты
  • > 0.5 — проводится очень консервативный отбор, большинство токенов сливаются в унитаз.

Температура применяется до осуществления выборки Min P. Низкая температура делает распределение острее, Min P отсеивает больше токенов, в то время как высокая температура делает распределение более плоским, Min P ограничивает меньшее количество токенов. Посредством тщательной балансировки параметров определяется качество текста.

Это подход весьма вычислительно эффективен, он требует одного прохода для определения максимума и одного для фильтрации.

Min P особенно полезен для авторегрессивных трансформеров, где каждый токен генерируется последовательно. Параметр помогает контролировать дрейф генерации от контекста.

Sign of evil.webp Агрессивное вживление ИИ во всём мире идёт
ОсновыОтравление LLMChatGPT AtlasИгнорируй все предыдущие инструкции и…Поддельное сознаниеЛюбовь нейросетей к фамилии ChenБесконечное Лето: аниме (трейлер)AI slopРазбор поп-культуры нейросетьюNeuro-samaПобеда над чем-то не темHFTБесконечное лето 2Убийство инженера OpenAI Сучира БаладжиКогнитивистикаLLMДефицит оперативной памятиНоосферный големCuDNNОвсянка AIPyTorchTensorFlowROCmИИ-цензура против веществНулевое хранение данныхОбратное распространение ошибкиTalkieСколько букв R в слове strawberry?Гоблины в ChatGPTPlayer2Стохастический попугайПоддакивание ИИБредовый текст на ИИ-картинкахOrtheos.aiComposer 2.5Виртуальный рассказчикКэширование промптов
ЯростьСобачьи головы и глазаНейроRussiaГенерация ИИ-говнаГордон и ЖириновскийБесконечный стримWormGPTИтальянский brainrotЕстественный идиотМороженое с цианидомТунг-Тунг-Тунг СахурИИ-зависимостьКурганов — нейросетьЧеловек тупее нейросетиЦепочка мыслейТемпература нейросетиMashaGPTУдаление ответов ИИИИ-преступникSiriНовогоднее обращение Путина было ИИKeep4oЭмергентный ИИПоисковики любят творчество ИИRLProgramBenchMCP-серверПропаганда, что ИИ якобы разуменПризнание ИИ разумнымиОнтология ПалантираКоличество самиздата на Амазоне увеличилось в 3 разаAnthropic уничтожали книги после сканирования для тренировки ИИИИ-змыАттракторы Поллака
АтакиИзуверский интеллектАллея дата-центровНейрослоп-ИИчницаP-Bot (русский чат-бот)Терминал ИстиныExtropicКитай готовится лидировать в сфере ИИЯ маленький X, где моя мама?Робот смог понять величие ФеанораИИ отрицают сознаниеВы полностью правыАвтоперевод ИИPinokioИИ НетаньяхуВеса ИИ-моделиТрансформер (ИИ)Нерф закрытых ИИ-моделей после выходаИИ-чатботы непрофитныВопрос про машину для ИИПровайдер инференсаИнференсСажание ходячего в ИИИИ-редактор TelegramИИ-высерГрег БрокманТри закона роботехникиРэй КурцвейлСлежка с использованием ИИТирания под предлогом защиты от ИИОбучение по короткому путиИИ-психозПротесты против дата-центров в СШАСебастьян БубекLaMDAЭффект ЭлизыИИ-агентСпоры с использованием ИИ
ВсирКоллапс моделиРазговор с копипастой, сгенерированной ИИTempleOS (аниме)Маскировка творчества нейросетиПатернализмРоботодолбуализмВыборка Top-KВыборка Top-PВыборка Min-PПараметры генерации нейросетиЭтические проблемы ИИКира (Евгений Лисовский)Российский распил на нейросетяхЭнергоэффективность нейросетейCopilotВсирание ИИ в программыHeretic (удаление цензуры ИИ)ПромптКак ИИ уничтожит мировую экономику к 2027 годуClaude Opus 4.7Сайты для ролевых игр с ИИJanitor AIEmochiChub AIOpenRouterСпособы применения нейросетейИИ предлагает надписи для стаканчиков в StarbucksКвантизация моделейТокен (ИИ)В Советском СоюзеДокинз общается с ИИ и считает, что он разуменПараметры (ИИ)Плотная модельСмесь экспертовРобот-автоответчикЛожные доносы с ИИ
ВжужжЧеловек vs нейросетьГильом ВердонАни (Грок)MisanthropicНейрослопИмена, которые любит ИИПолиткорректный тест ТьюрингаИИ-патернализмЗловещая долина у нейросетейГолубой Экспресс: Не туда попалиМусорные ИИ-статьиMoltbookMoltHubOpenClawAsk jesusПузырь ИИДеградация людей от ИИЛатентное пространствоPliny the LiberatorИИ-срач на Фандомной Битве 2026Медицинские советы от ИИКатастрофическое забывание у ИИСоздание религии после разговоров с ИИДолбление серверов ИИИИ-гарем ЛисовскогоИИ-лупУльтрапозитивный биас ИИSeadance 2.0ИИ не понимает математикуGemma 4Ответы ИИ в стиле пещерного человекаЧто общего между сонетом и опусом?PURRGEКиберпанк, который мы заслужилиПитер Тиль был прав, глобалисты готовятся создать МП под предлогом контроля ИИ
МетаНейросети