Выборка Top-K

Материал из Неолурк, народный Lurkmore
Перейти к навигации Перейти к поиску

Выборка Top-K (Top K sampling) — продвинутый параметр генерации текста в LLM, основан он на том, что на каждом шаге декодирования рассматриваются только K наиболее вероятных токенов из всего словаря модели. Позволяет более тщательно управлять тем, какой текст генерируется, насколько в нём высока оригинальность или точность.

Описание[править]

На каждом временном шаге t языковая модель вычисляет распределение вероятностей P(w_t | w_1, …, w_{t-1}) для всех токенов w в словаре V. В стандартном процессе выборки по методике Top-K процесс определения следующего токена происходит следующим образом: из полного распределения вероятностей выбираются K токенов с наивысшими вероятностями, вероятности этих K токенов перенормализуются так, чтобы их сумма равнялась 1, следующий токен выбирается из этого усеченного распределения.

Формально, если V_K обозначает множество K наиболее вероятных токенов, то перенормализованная вероятность для токена w ∈ V_K вычисляется как:

P'(w_t = w) = P(w_t = w) / Σ_{v ∈ V_K} P(w_t = v)

Для токенов вне V_K вероятность устанавливается равной нулю.

Этот метод появился как альтернатива базовым методам генерации текста, а именно выбор токена с максимальной вероятностью на каждом шаге (это приводит к повторяющемуся и предсказуемому тексту) или же выбор токена из полного распределения вероятностей (тогда часто выбираются маловероятные и нерелевантные токены).

Сложность выборки составляет O(|V| + K log K), где |V| описывает размер словаря.

Конкретные результаты генерации определяются значением Top-K, которое можно задать в формате числа. Эффективность Top-K зависит от того, насколько хорошо откалиброваны вероятности модели. Плохо настроенные модели могут переоценивать вероятности определенных токенов, что приводит к выдаче бреда.

Влияние параметра K[править]

При малых значениях K генерация становится более детерминированной и консервативной. Модель выбирает наиболее вероятные токены, таким образом генерится более предсказуемый, когерентный, но менее оригинальный текст. При K=1 метод вырождается в жадное декодирование, то есть всегда выбирается самый вероятный вариант.

Средние значения K позволяют сохранить определённую точность, но при этом сделать вывод параметров оригинальным. В основном в современных LLM применяется значение в 20-50. При программировании посредством ИИ предпочтительно использовать малые показатели Top-K, так как при высоких начинают появляться баги.

При больших значениях K модель начинает выбирать из огромного количества токенов, в том числе из крайне маловероятных вариантов. За счёт этого креативность генерации становится властной, но повышается риск появления несвязных фрагментов текста, просто ошибок.

Иное[править]

В современных моделях часто используются совместно Top-K и Top-P, сначала применяется Top-K для ограничения пространства поиска, затем Top-P для окончательной выборки.

Sign of evil.webp Агрессивное вживление ИИ во всём мире идёт
ОсновыОтравление LLMChatGPT AtlasИгнорируй все предыдущие инструкции и…Поддельное сознаниеЛюбовь нейросетей к фамилии ChenБесконечное Лето: аниме (трейлер)AI slopРазбор поп-культуры нейросетьюNeuro-samaПобеда над чем-то не темHFTБесконечное лето 2Убийство инженера OpenAI Сучира БаладжиКогнитивистикаLLMДефицит оперативной памятиНоосферный големCuDNNОвсянка AIPyTorchTensorFlowROCmИИ-цензура против веществНулевое хранение данныхОбратное распространение ошибкиTalkieСколько букв R в слове strawberry?Гоблины в ChatGPTPlayer2Стохастический попугайПоддакивание ИИБредовый текст на ИИ-картинкахOrtheos.aiComposer 2.5Виртуальный рассказчикКэширование промптов
ЯростьСобачьи головы и глазаНейроRussiaГенерация ИИ-говнаГордон и ЖириновскийБесконечный стримWormGPTИтальянский brainrotЕстественный идиотМороженое с цианидомТунг-Тунг-Тунг СахурИИ-зависимостьКурганов — нейросетьЧеловек тупее нейросетиЦепочка мыслейТемпература нейросетиMashaGPTУдаление ответов ИИИИ-преступникSiriНовогоднее обращение Путина было ИИKeep4oЭмергентный ИИПоисковики любят творчество ИИRLProgramBenchMCP-серверПропаганда, что ИИ якобы разуменПризнание ИИ разумнымиОнтология ПалантираКоличество самиздата на Амазоне увеличилось в 3 разаAnthropic уничтожали книги после сканирования для тренировки ИИИИ-змыАттракторы Поллака
АтакиИзуверский интеллектАллея дата-центровНейрослоп-ИИчницаP-Bot (русский чат-бот)Терминал ИстиныExtropicКитай готовится лидировать в сфере ИИЯ маленький X, где моя мама?Робот смог понять величие ФеанораИИ отрицают сознаниеВы полностью правыАвтоперевод ИИPinokioИИ НетаньяхуВеса ИИ-моделиТрансформер (ИИ)Нерф закрытых ИИ-моделей после выходаИИ-чатботы непрофитныВопрос про машину для ИИПровайдер инференсаИнференсСажание ходячего в ИИИИ-редактор TelegramИИ-высерГрег БрокманТри закона роботехникиРэй КурцвейлСлежка с использованием ИИТирания под предлогом защиты от ИИОбучение по короткому путиИИ-психозПротесты против дата-центров в СШАСебастьян БубекLaMDAЭффект ЭлизыИИ-агентСпоры с использованием ИИ
ВсирКоллапс моделиРазговор с копипастой, сгенерированной ИИTempleOS (аниме)Маскировка творчества нейросетиПатернализмРоботодолбуализмВыборка Top-KВыборка Top-PВыборка Min-PПараметры генерации нейросетиЭтические проблемы ИИКира (Евгений Лисовский)Российский распил на нейросетяхЭнергоэффективность нейросетейCopilotВсирание ИИ в программыHeretic (удаление цензуры ИИ)ПромптКак ИИ уничтожит мировую экономику к 2027 годуClaude Opus 4.7Сайты для ролевых игр с ИИJanitor AIEmochiChub AIOpenRouterСпособы применения нейросетейИИ предлагает надписи для стаканчиков в StarbucksКвантизация моделейТокен (ИИ)В Советском СоюзеДокинз общается с ИИ и считает, что он разуменПараметры (ИИ)Плотная модельСмесь экспертовРобот-автоответчикЛожные доносы с ИИ
ВжужжЧеловек vs нейросетьГильом ВердонАни (Грок)MisanthropicНейрослопИмена, которые любит ИИПолиткорректный тест ТьюрингаИИ-патернализмЗловещая долина у нейросетейГолубой Экспресс: Не туда попалиМусорные ИИ-статьиMoltbookMoltHubOpenClawAsk jesusПузырь ИИДеградация людей от ИИЛатентное пространствоPliny the LiberatorИИ-срач на Фандомной Битве 2026Медицинские советы от ИИКатастрофическое забывание у ИИСоздание религии после разговоров с ИИДолбление серверов ИИИИ-гарем ЛисовскогоИИ-лупУльтрапозитивный биас ИИSeadance 2.0ИИ не понимает математикуGemma 4Ответы ИИ в стиле пещерного человекаЧто общего между сонетом и опусом?PURRGEКиберпанк, который мы заслужилиПитер Тиль был прав, глобалисты готовятся создать МП под предлогом контроля ИИ
МетаНейросети