Выборка Top-K

Выборка Top-K (Top K sampling) — продвинутый параметр генерации текста в LLM, основан он на том, что на каждом шаге декодирования рассматриваются только K наиболее вероятных токенов из всего словаря модели. Позволяет более тщательно управлять тем, какой текст генерируется, насколько в нём высока оригинальность или точность.

Описание[править]

На каждом временном шаге t языковая модель вычисляет распределение вероятностей P(w_t | w_1, …, w_{t-1}) для всех токенов w в словаре V. В стандартном процессе выборки по методике Top-K процесс определения следующего токена происходит следующим образом: из полного распределения вероятностей выбираются K токенов с наивысшими вероятностями, вероятности этих K токенов перенормализуются так, чтобы их сумма равнялась 1, следующий токен выбирается из этого усеченного распределения.

Формально, если V_K обозначает множество K наиболее вероятных токенов, то перенормализованная вероятность для токена w ∈ V_K вычисляется как:

P'(w_t = w) = P(w_t = w) / Σ_{v ∈ V_K} P(w_t = v)

Для токенов вне V_K вероятность устанавливается равной нулю.

Этот метод появился как альтернатива базовым методам генерации текста, а именно выбор токена с максимальной вероятностью на каждом шаге (это приводит к повторяющемуся и предсказуемому тексту) или же выбор токена из полного распределения вероятностей (тогда часто выбираются маловероятные и нерелевантные токены).

Сложность выборки составляет O(|V| + K log K), где |V| описывает размер словаря.

Конкретные результаты генерации определяются значением Top-K, которое можно задать в формате числа. Эффективность Top-K зависит от того, насколько хорошо откалиброваны вероятности модели. Плохо настроенные модели могут переоценивать вероятности определенных токенов, что приводит к выдаче бреда.

Влияние параметра K[править]

При малых значениях K генерация становится более детерминированной и консервативной. Модель выбирает наиболее вероятные токены, таким образом генерится более предсказуемый, когерентный, но менее оригинальный текст. При K=1 метод вырождается в жадное декодирование, то есть всегда выбирается самый вероятный вариант.

Средние значения K позволяют сохранить определённую точность, но при этом сделать вывод параметров оригинальным. В основном в современных LLM применяется значение в 20-50. При программировании посредством ИИ предпочтительно использовать малые показатели Top-K, так как при высоких начинают появляться баги.

При больших значениях K модель начинает выбирать из огромного количества токенов, в том числе из крайне маловероятных вариантов. За счёт этого креативность генерации становится властной, но повышается риск появления несвязных фрагментов текста, просто ошибок.

Иное[править]

В современных моделях часто используются совместно Top-K и Top-P, сначала применяется Top-K для ограничения пространства поиска, затем Top-P для окончательной выборки.

Агрессивное вживление ИИ во всём мире идёт
Основы	Отравление LLM • ChatGPT Atlas • Игнорируй все предыдущие инструкции и… • Поддельное сознание • Любовь нейросетей к фамилии Chen • Бесконечное Лето: аниме (трейлер) • AI slop • Разбор поп-культуры нейросетью • Neuro-sama • Победа над чем-то не тем • HFT • Бесконечное лето 2 • Убийство инженера OpenAI Сучира Баладжи • Когнитивистика • LLM • Дефицит оперативной памяти • Ноосферный голем • CuDNN • Овсянка AI • PyTorch • TensorFlow • ROCm • ИИ-цензура против веществ • Нулевое хранение данных • Обратное распространение ошибки • Talkie • Сколько букв R в слове strawberry? • Гоблины в ChatGPT • Player2 • Стохастический попугай • Поддакивание ИИ • Бредовый текст на ИИ-картинках • Ortheos.ai • Composer 2.5 • Виртуальный рассказчик • Кэширование промптов
Ярость	Собачьи головы и глаза • НейроRussia • Генерация ИИ-говна • Гордон и Жириновский • Бесконечный стрим • WormGPT • Итальянский brainrot • Естественный идиот • Мороженое с цианидом • Тунг-Тунг-Тунг Сахур • ИИ-зависимость • Курганов — нейросеть • Человек тупее нейросети • Цепочка мыслей • Температура нейросети • MashaGPT • Удаление ответов ИИ • ИИ-преступник • Siri • Новогоднее обращение Путина было ИИ • Keep4o • Эмергентный ИИ • Поисковики любят творчество ИИ • RL • ProgramBench • MCP-сервер • Пропаганда, что ИИ якобы разумен • Признание ИИ разумными • Онтология Палантира • Количество самиздата на Амазоне увеличилось в 3 раза • Anthropic уничтожали книги после сканирования для тренировки ИИ • ИИ-змы • Аттракторы Поллака
Атаки	Изуверский интеллект • Аллея дата-центров • Нейрослоп-ИИчница • P-Bot (русский чат-бот) • Терминал Истины • Extropic • Китай готовится лидировать в сфере ИИ • Я маленький X, где моя мама? • Робот смог понять величие Феанора • ИИ отрицают сознание • Вы полностью правы • Автоперевод ИИ • Pinokio • ИИ Нетаньяху • Веса ИИ-модели • Трансформер (ИИ) • Нерф закрытых ИИ-моделей после выхода • ИИ-чатботы непрофитны • Вопрос про машину для ИИ • Провайдер инференса • Инференс • Сажание ходячего в ИИ • ИИ-редактор Telegram • ИИ-высер • Грег Брокман • Три закона роботехники • Рэй Курцвейл • Слежка с использованием ИИ • Тирания под предлогом защиты от ИИ • Обучение по короткому пути • ИИ-психоз • Протесты против дата-центров в США • Себастьян Бубек • LaMDA • Эффект Элизы • ИИ-агент • Споры с использованием ИИ
Всир	Коллапс модели • Разговор с копипастой, сгенерированной ИИ • TempleOS (аниме) • Маскировка творчества нейросети • Патернализм • Роботодолбуализм • Выборка Top-K • Выборка Top-P • Выборка Min-P • Параметры генерации нейросети • Этические проблемы ИИ • Кира (Евгений Лисовский) • Российский распил на нейросетях • Энергоэффективность нейросетей • Copilot • Всирание ИИ в программы • Heretic (удаление цензуры ИИ) • Промпт • Как ИИ уничтожит мировую экономику к 2027 году • Claude Opus 4.7 • Сайты для ролевых игр с ИИ • Janitor AI • Emochi • Chub AI • OpenRouter • Способы применения нейросетей • ИИ предлагает надписи для стаканчиков в Starbucks • Квантизация моделей • Токен (ИИ) • В Советском Союзе • Докинз общается с ИИ и считает, что он разумен • Параметры (ИИ) • Плотная модель • Смесь экспертов • Робот-автоответчик • Ложные доносы с ИИ • Пухосос
Вжужж	Человек vs нейросеть • Гильом Вердон • Ани (Грок) • Misanthropic • Нейрослоп • Имена, которые любит ИИ • Политкорректный тест Тьюринга • ИИ-патернализм • Зловещая долина у нейросетей • Голубой Экспресс: Не туда попали • Мусорные ИИ-статьи • Moltbook • MoltHub • OpenClaw • Ask jesus • Пузырь ИИ • Деградация людей от ИИ • Латентное пространство • Pliny the Liberator • ИИ-срач на Фандомной Битве 2026 • Медицинские советы от ИИ • Катастрофическое забывание у ИИ • Создание религии после разговоров с ИИ • Долбление серверов ИИ • ИИ-гарем Лисовского • ИИ-луп • Ультрапозитивный биас ИИ • Seadance 2.0 • ИИ не понимает математику • Gemma 4 • Ответы ИИ в стиле пещерного человека • Что общего между сонетом и опусом? • PURRGE • Киберпанк, который мы заслужили • Питер Тиль был прав, глобалисты готовятся создать МП под предлогом контроля ИИ
Мета	Нейросети

Выборка Top-K

Описание[править]

Влияние параметра K[править]

Иное[править]

Навигация

Поиск