Выборка Top-P

Материал из Неолурк, народный Lurkmore
Перейти к навигации Перейти к поиску

Выборка Top-P (Top P sampling, также nucleus sampling или выборка по ядру) — продвинутый параметр генерации текста в LLM. Он контролирует оригинальность генерируемого текста посредством динамического ограничения множества кандидатов на основе их общей вероятности. Параметр P определяет минимальную суммарную вероятность наиболее вероятных токенов, из которых производится выборка.

Описание[править]

При генерации каждого следующего токена языковая модель вычисляет распределение вероятностей для всех токенов в словаре. Все возможные токены сортируются по убыванию их вероятностей, затем токены добавляются в ядро последовательно, начиная с наиболее вероятного, до тех пор, пока суммарная вероятность не достигнет или превысит заданное значение P. После этого вероятности токенов внутри ядра перенормализуются так, чтобы их сумма равнялась 1. Затем из полученного ядра случайным образом выбирается один токен, который и определяет продолжение текста.

Параметр Top P принимает значения в диапазоне от 0 до 1, для простоты обычно выбираются значения, которые кратны для 0.1 или 0.05.

При малых значениях, таких как 0.1, осуществляется максимально консервативная генерация. Модель выбирает из минимального набора наиболее вероятных токенов. Текст получается предсказуемым, повторяющимся, унылым но грамматически корректным. При 0.5 происходит умеренная генерация, повторяться текст может, но при этом достигается высокая точность. Во многих современных ассистентах применяется значение в 0.9, где выдаётся довольно оригинальный текст, в котором могут быть ошибки. При значениях в 0.95-1.0 уже может попереть явный бред.

Особенности[править]

При острых распределениях, когда один токен имеет очень высокую вероятность, Top P может выбирать из одного-двух токенов, а при плоских распределениях из десятков. Top K вообще никак не адаптируется к форме распределения. Для формирования распределения используется параметр температуры. Top P всегда применяется после модификации распределения температурой.

Sign of evil.webp Агрессивное вживление ИИ во всём мире идёт
ОсновыОтравление LLMChatGPT AtlasИгнорируй все предыдущие инструкции и…Поддельное сознаниеЛюбовь нейросетей к фамилии ChenБесконечное Лето: аниме (трейлер)AI slopРазбор поп-культуры нейросетьюNeuro-samaПобеда над чем-то не темHFTБесконечное лето 2Убийство инженера OpenAI Сучира БаладжиКогнитивистикаLLMДефицит оперативной памятиНоосферный големCuDNNОвсянка AIPyTorchTensorFlowROCmИИ-цензура против веществНулевое хранение данныхОбратное распространение ошибкиTalkieСколько букв R в слове strawberry?Гоблины в ChatGPTPlayer2Стохастический попугайПоддакивание ИИБредовый текст на ИИ-картинкахOrtheos.aiComposer 2.5Виртуальный рассказчикКэширование промптов
ЯростьСобачьи головы и глазаНейроRussiaГенерация ИИ-говнаГордон и ЖириновскийБесконечный стримWormGPTИтальянский brainrotЕстественный идиотМороженое с цианидомТунг-Тунг-Тунг СахурИИ-зависимостьКурганов — нейросетьЧеловек тупее нейросетиЦепочка мыслейТемпература нейросетиMashaGPTУдаление ответов ИИИИ-преступникSiriНовогоднее обращение Путина было ИИKeep4oЭмергентный ИИПоисковики любят творчество ИИRLProgramBenchMCP-серверПропаганда, что ИИ якобы разуменПризнание ИИ разумнымиОнтология ПалантираКоличество самиздата на Амазоне увеличилось в 3 разаAnthropic уничтожали книги после сканирования для тренировки ИИИИ-змыАттракторы Поллака
АтакиИзуверский интеллектАллея дата-центровНейрослоп-ИИчницаP-Bot (русский чат-бот)Терминал ИстиныExtropicКитай готовится лидировать в сфере ИИЯ маленький X, где моя мама?Робот смог понять величие ФеанораИИ отрицают сознаниеВы полностью правыАвтоперевод ИИPinokioИИ НетаньяхуВеса ИИ-моделиТрансформер (ИИ)Нерф закрытых ИИ-моделей после выходаИИ-чатботы непрофитныВопрос про машину для ИИПровайдер инференсаИнференсСажание ходячего в ИИИИ-редактор TelegramИИ-высерГрег БрокманТри закона роботехникиРэй КурцвейлСлежка с использованием ИИТирания под предлогом защиты от ИИОбучение по короткому путиИИ-психозПротесты против дата-центров в СШАСебастьян БубекLaMDAЭффект ЭлизыИИ-агентСпоры с использованием ИИ
ВсирКоллапс моделиРазговор с копипастой, сгенерированной ИИTempleOS (аниме)Маскировка творчества нейросетиПатернализмРоботодолбуализмВыборка Top-KВыборка Top-PВыборка Min-PПараметры генерации нейросетиЭтические проблемы ИИКира (Евгений Лисовский)Российский распил на нейросетяхЭнергоэффективность нейросетейCopilotВсирание ИИ в программыHeretic (удаление цензуры ИИ)ПромптКак ИИ уничтожит мировую экономику к 2027 годуClaude Opus 4.7Сайты для ролевых игр с ИИJanitor AIEmochiChub AIOpenRouterСпособы применения нейросетейИИ предлагает надписи для стаканчиков в StarbucksКвантизация моделейТокен (ИИ)В Советском СоюзеДокинз общается с ИИ и считает, что он разуменПараметры (ИИ)Плотная модельСмесь экспертовРобот-автоответчикЛожные доносы с ИИ
ВжужжЧеловек vs нейросетьГильом ВердонАни (Грок)MisanthropicНейрослопИмена, которые любит ИИПолиткорректный тест ТьюрингаИИ-патернализмЗловещая долина у нейросетейГолубой Экспресс: Не туда попалиМусорные ИИ-статьиMoltbookMoltHubOpenClawAsk jesusПузырь ИИДеградация людей от ИИЛатентное пространствоPliny the LiberatorИИ-срач на Фандомной Битве 2026Медицинские советы от ИИКатастрофическое забывание у ИИСоздание религии после разговоров с ИИДолбление серверов ИИИИ-гарем ЛисовскогоИИ-лупУльтрапозитивный биас ИИSeadance 2.0ИИ не понимает математикуGemma 4Ответы ИИ в стиле пещерного человекаЧто общего между сонетом и опусом?PURRGEКиберпанк, который мы заслужилиПитер Тиль был прав, глобалисты готовятся создать МП под предлогом контроля ИИ
МетаНейросети