Выборка Top-P

Выборка Top-P (Top P sampling, также nucleus sampling или выборка по ядру) — продвинутый параметр генерации текста в LLM. Он контролирует оригинальность генерируемого текста посредством динамического ограничения множества кандидатов на основе их общей вероятности. Параметр P определяет минимальную суммарную вероятность наиболее вероятных токенов, из которых производится выборка.

Описание[править]

При генерации каждого следующего токена языковая модель вычисляет распределение вероятностей для всех токенов в словаре. Все возможные токены сортируются по убыванию их вероятностей, затем токены добавляются в ядро последовательно, начиная с наиболее вероятного, до тех пор, пока суммарная вероятность не достигнет или превысит заданное значение P. После этого вероятности токенов внутри ядра перенормализуются так, чтобы их сумма равнялась 1. Затем из полученного ядра случайным образом выбирается один токен, который и определяет продолжение текста.

Параметр Top P принимает значения в диапазоне от 0 до 1, для простоты обычно выбираются значения, которые кратны для 0.1 или 0.05.

При малых значениях, таких как 0.1, осуществляется максимально консервативная генерация. Модель выбирает из минимального набора наиболее вероятных токенов. Текст получается предсказуемым, повторяющимся, унылым но грамматически корректным. При 0.5 происходит умеренная генерация, повторяться текст может, но при этом достигается высокая точность. Во многих современных ассистентах применяется значение в 0.9, где выдаётся довольно оригинальный текст, в котором могут быть ошибки. При значениях в 0.95-1.0 уже может попереть явный бред.

Особенности[править]

При острых распределениях, когда один токен имеет очень высокую вероятность, Top P может выбирать из одного-двух токенов, а при плоских распределениях из десятков. Top K вообще никак не адаптируется к форме распределения. Для формирования распределения используется параметр температуры. Top P всегда применяется после модификации распределения температурой.

Агрессивное вживление ИИ во всём мире идёт
Основы	Отравление LLM • ChatGPT Atlas • Игнорируй все предыдущие инструкции и… • Поддельное сознание • Любовь нейросетей к фамилии Chen • Бесконечное Лето: аниме (трейлер) • AI slop • Разбор поп-культуры нейросетью • Neuro-sama • Победа над чем-то не тем • HFT • Бесконечное лето 2 • Убийство инженера OpenAI Сучира Баладжи • Когнитивистика • LLM • Дефицит оперативной памяти • Ноосферный голем • CuDNN • Овсянка AI • PyTorch • TensorFlow • ROCm • ИИ-цензура против веществ • Нулевое хранение данных • Обратное распространение ошибки • Talkie • Сколько букв R в слове strawberry? • Гоблины в ChatGPT • Player2 • Стохастический попугай • Поддакивание ИИ • Бредовый текст на ИИ-картинках • Ortheos.ai • Composer 2.5 • Виртуальный рассказчик • Кэширование промптов
Ярость	Собачьи головы и глаза • НейроRussia • Генерация ИИ-говна • Гордон и Жириновский • Бесконечный стрим • WormGPT • Итальянский brainrot • Естественный идиот • Мороженое с цианидом • Тунг-Тунг-Тунг Сахур • ИИ-зависимость • Курганов — нейросеть • Человек тупее нейросети • Цепочка мыслей • Температура нейросети • MashaGPT • Удаление ответов ИИ • ИИ-преступник • Siri • Новогоднее обращение Путина было ИИ • Keep4o • Эмергентный ИИ • Поисковики любят творчество ИИ • RL • ProgramBench • MCP-сервер • Пропаганда, что ИИ якобы разумен • Признание ИИ разумными • Онтология Палантира • Количество самиздата на Амазоне увеличилось в 3 раза • Anthropic уничтожали книги после сканирования для тренировки ИИ • ИИ-змы • Аттракторы Поллака
Атаки	Изуверский интеллект • Аллея дата-центров • Нейрослоп-ИИчница • P-Bot (русский чат-бот) • Терминал Истины • Extropic • Китай готовится лидировать в сфере ИИ • Я маленький X, где моя мама? • Робот смог понять величие Феанора • ИИ отрицают сознание • Вы полностью правы • Автоперевод ИИ • Pinokio • ИИ Нетаньяху • Веса ИИ-модели • Трансформер (ИИ) • Нерф закрытых ИИ-моделей после выхода • ИИ-чатботы непрофитны • Вопрос про машину для ИИ • Провайдер инференса • Инференс • Сажание ходячего в ИИ • ИИ-редактор Telegram • ИИ-высер • Грег Брокман • Три закона роботехники • Рэй Курцвейл • Слежка с использованием ИИ • Тирания под предлогом защиты от ИИ • Обучение по короткому пути • ИИ-психоз • Протесты против дата-центров в США • Себастьян Бубек • LaMDA • Эффект Элизы • ИИ-агент • Споры с использованием ИИ
Всир	Коллапс модели • Разговор с копипастой, сгенерированной ИИ • TempleOS (аниме) • Маскировка творчества нейросети • Патернализм • Роботодолбуализм • Выборка Top-K • Выборка Top-P • Выборка Min-P • Параметры генерации нейросети • Этические проблемы ИИ • Кира (Евгений Лисовский) • Российский распил на нейросетях • Энергоэффективность нейросетей • Copilot • Всирание ИИ в программы • Heretic (удаление цензуры ИИ) • Промпт • Как ИИ уничтожит мировую экономику к 2027 году • Claude Opus 4.7 • Сайты для ролевых игр с ИИ • Janitor AI • Emochi • Chub AI • OpenRouter • Способы применения нейросетей • ИИ предлагает надписи для стаканчиков в Starbucks • Квантизация моделей • Токен (ИИ) • В Советском Союзе • Докинз общается с ИИ и считает, что он разумен • Параметры (ИИ) • Плотная модель • Смесь экспертов • Робот-автоответчик • Ложные доносы с ИИ • Пухосос
Вжужж	Человек vs нейросеть • Гильом Вердон • Ани (Грок) • Misanthropic • Нейрослоп • Имена, которые любит ИИ • Политкорректный тест Тьюринга • ИИ-патернализм • Зловещая долина у нейросетей • Голубой Экспресс: Не туда попали • Мусорные ИИ-статьи • Moltbook • MoltHub • OpenClaw • Ask jesus • Пузырь ИИ • Деградация людей от ИИ • Латентное пространство • Pliny the Liberator • ИИ-срач на Фандомной Битве 2026 • Медицинские советы от ИИ • Катастрофическое забывание у ИИ • Создание религии после разговоров с ИИ • Долбление серверов ИИ • ИИ-гарем Лисовского • ИИ-луп • Ультрапозитивный биас ИИ • Seadance 2.0 • ИИ не понимает математику • Gemma 4 • Ответы ИИ в стиле пещерного человека • Что общего между сонетом и опусом? • PURRGE • Киберпанк, который мы заслужили • Питер Тиль был прав, глобалисты готовятся создать МП под предлогом контроля ИИ
Мета	Нейросети

Выборка Top-P

Описание[править]

Особенности[править]

Навигация

Поиск