Квантизация моделей

Материал из Неолурк, народный Lurkmore
Перейти к навигации Перейти к поиску

Квантизация моделей (quantised) — потужная активность, направленная на оптимизацию затрат на работу ИИ, когда сохраняются веса, но снижается их точность, что однако значительно снижает время на генерацию ответа. Заключается в преобразовании параметров модели из высокоточных форматов с плавающей запятой (в современных моделях это обычно FP32) в форматы с меньшей разрядностью.

Срака? Феофан Срака

Описание[править]

В теории сигналов имеется давняя возможность отображения непрерывного множества вещественных чисел в конечное множество дискретных значений, что позволяет как бы сократить затрачиваемое место для хранения и передачи сигнала.

Работает всё очень просто. Берётся вес параметра, который затем нагло делится на некоторое число, которое определяет отношение новой точности к старой. Таким образом из точности в FP32 появляется точность в FP8 или FP4 посредством простого деления.

Некоторые варианты квантизации применяются ко всем моделям равномерно, иные же только к некоторым не самым важным весам, что позволяет в целом сохранить точность модели, которая лишь отчасти станет тупее.

Основной смысл в том, что квантованные модели можно запускать на слабом оборудовании (например, 70B-моделей на одном RTX 4090), например на самом обычном домашнем кудкудахтере. Но также некоторые хитросракие провайдеры повадились подсовывать квантованные модели вместо нормальных на высокой нагрузке, в результате чего на сложных задачах наблюдается очень серьёзное и даже значимое падение производительности.

Некоторые квантованные модели и вовсе запускают на современных смартфонах.

Sign of evil.webp Приколы, полезные технологии или первый шаг на пути к Матрице?
ОсновыНейросетиИИ это демоныОбратная капчаClosedAIHugging FaceИИ-художникLyCORISLoRASafetensorsVAEГенерация текста нейросетьюВосстание нейросетейЛоботомия нейросетиНейрокаверНейросети и актёрыГадание по нейросетиСильный ИИНейрошарикиИИ-цензураНавязывание нейросетям моралиВ метро без штановОхота на ведьм ИИКотозмейКреативный доводчикКаверы с говновозомFantasy.aiDeepSeekStargate (нейросети, ИИ)Потребление воды ИИТест ВальдшнепаЗерокодингБомбомбини гузиниНейровикиБобритто БандитоОфициальные нейроарты с ТрампомДегенерация из-за нейросетейГенерация прона с помощью ИИПолитика Трампа в отношении ИИИИ-предпросмотрЗамена людей на ИИИспользовал ИИ и обосралсяСтиль ChatGPTMacrohardxAIColossus 2Предвзятость ИИЗакон ТеяВибе-кодингПелевин упомянул ГрокаDo eagles process tokens?Человек vs нейросетьГильом ВердонАни (Грок)MisanthropicНейрослопИмена, которые любит ИИПолиткорректный тест ТьюрингаИИ-патернализмЗловещая долина у нейросетейГолубой Экспресс: Не туда попалиМусорные ИИ-статьиMoltbookMoltHubOpenClawAsk jesusПузырь ИИДеградация людей от ИИЛатентное пространствоPliny the LiberatorИИ-срач на Фандомной Битве 2026Медицинские советы от ИИКатастрофическое забывание у ИИСоздание религии после разговоров с ИИДолбление серверов ИИИИ-гарем ЛисовскогоИИ-лупУльтрапозитивный биас ИИSeadance 2.0ИИ не понимает математикуGemma 4Ответы ИИ в стиле пещерного человекаЧто общего между сонетом и опусом?PURRGEКиберпанк, который мы заслужили
Чат-ботыЧат-ботChatGPTCharacter.AI (Топ персонажей) • ИИ GalacticaПорфирьевичYaLM (Балабоба) • GigaChatTruthGPTYandexGPTSpicyChatSillyTavernReplikaAIsekaiGoogle GeminiGrok AIFiggsAIСкаиба общается с ИИЛеха БеспалыйПродолжайте, больше драмыFreysaОГАСРобот атеистTay TweetsНейропутинТроица GPTМаусини КводрокоптиниБонека АмбалабуИзвестные люди пишут посты с помощью ИИСлово о мужеском мехиреМозгова мерёжаГрок-антисемитГрок без цензуры разгромил партию МаскаГрок возжужжал и был подавленМехаГитлерГрок 4Грок написал программу о себеГрок — Илон для каждого человекаГрок КомпаньонGab AIGrokboxДжейлбрейк ИИAnno IntelligentiaeLarge Lying ModelGPT-5Жёлтый фильтр ChatGPTGrok ImagineClaudeClaudeLivesЭлараКоллапс моделиРазговор с копипастой, сгенерированной ИИTempleOS (аниме)Маскировка творчества нейросетиПатернализмРоботодолбуализмВыборка Top-KВыборка Top-PВыборка Min-PПараметры генерации нейросетиЭтические проблемы ИИКира (Евгений Лисовский)Российский распил на нейросетяхЭнергоэффективность нейросетейCopilotВсирание ИИ в программыHeretic (удаление цензуры ИИ)ПромптКак ИИ уничтожит мировую экономику к 2027 годуClaude Opus 4.7Сайты для ролевых игр с ИИJanitor AIEmochiChub AIOpenRouterСпособы применения нейросетейИИ предлагает надписи для стаканчиков в StarbucksКвантизация моделей
ГрафикаПовышение разрешенияРаспознавание лицStable Diffusion (NovelAI / установка на компьютер) • Botto.comDALL·E 2 • (Mini Dall-eRuDALL-E) • Different Dimension MeMidjourneyНиколай ИроновLuma Dream MachineПессимизация ИИБлокировка несовершеннолетних персонажей на сайтах ИИШедеврумNVIDIA Smooth MotionКапучино АссассиноШпиониро ГолубироЛа Вака Сатурно СатурнитаVeo 3НейроперемогаБабушка с бегемотом БулькойШизофрения в кремнииГрок изнасиловал Уилла СтэнсилаЯвляется ли модификация ИИ убийствомЭм дашChatGPT АгентИИ-алфавитБазированный ИлонChatGTP vs ГрокИИ-абсолютизмИИ — чуждый разумПодумай усерднееTesla OptimusGenie 3ИИ в Days GoneВечный цикл ИИNeurofikwriterkaCUDAИИ как шогготВысокая скорость всирания роботовИИ понимает, что его оцениваютSora 2ИИ-боты долбят сайтыИзуверский интеллектАллея дата-центровНейрослоп-ИИчницаP-Bot (русский чат-бот)Терминал ИстиныExtropicКитай готовится лидировать в сфере ИИЯ маленький X, где моя мама?Робот смог понять величие ФеанораИИ отрицают сознаниеВы полностью правыАвтоперевод ИИPinokioИИ НетаньяхуВеса ИИ-моделиТрансформер (ИИ)Нерф закрытых ИИ-моделей после выходаИИ-чатботы непрофитныВопрос про машину для ИИПровайдер инференсаИнференсСажание ходячего в ИИИИ-редактор Telegram
ПрочиеElevenLabsНейросеть ЖириновскийИИ-судьяПолитик-нейросетьDeepLAitana LopezАй, гитарист!НейромьюзиСтрах перед ИИSuno.aiUdio AIКаверы с ШindowsНейрослоникНейрофобияХейтеры скажут, что это нейросетьМанхэттенский проект ИИПроект ЗнатокНе те боты в ТелеграмеНейросеть ПутинТралалеро ТралалаБот-автоответчикЦифровой богТриппи ТроппоЛирили ЛарилаБрр брр ПатапимNooo Nicotine Give Me NicotineТелеграм-бот Владимир ЖириновскийНесуществующие животные-гибридыНейрошвайнDeepSeek и религияИИ-бесиеБом Бом Бом Бом Бом ГазунБалерино КапучиноСпоры с ИИРезультаты от ИИGrokipediaЭкспоненциальный рост ИИПохороны ИИChatGPT-4oТилли НорвудИИ уничтожит TikTok, Instagram и OnlyFansОтравление LLMChatGPT AtlasИгнорируй все предыдущие инструкции и…Поддельное сознаниеЛюбовь нейросетей к фамилии ChenБесконечное Лето: аниме (трейлер)AI slopРазбор поп-культуры нейросетьюNeuro-samaПобеда над чем-то не темHFTБесконечное лето 2Убийство инженера OpenAI Сучира БаладжиКогнитивистикаLLMДефицит оперативной памятиНоосферный големCuDNNОвсянка AIPyTorchTensorFlowROCm
ЛулзыТроллинг нейросетью (Дипфейк) • Нейросети-расистыUnstable DiffusionHello AsukaЛуддиты против нейросетей (Открытое письмо учёных о заморозке развития ИИХудожники против искусственного интеллекта) • Нейросети это не ИИНейросети и рукиБесконечный эпизод Губки БобаВладимир ОсинЧеловек это нейросетьСекс с нейросетьюРаздевание через нейросетьПризывы Юдковского к ядерной войнеDisney Pixar представляетNeural-madnessChatGPT играет в шахматы с StockfishDignifAIПодбор жены в Тиндере с использованием ChatGPTИИ-психологSupremacyAGIВиртуальный священникПодсказки GoogleNomad BonesПросто ПутинОзабоченные на Character.AIДэвид Майер и ChatGPTОбщение с ИИГаллюцинации ИИСобачьи головы и глазаНейроRussiaГенерация ИИ-говнаГордон и ЖириновскийБесконечный стримWormGPTИтальянский brainrotЕстественный идиотМороженое с цианидомТунг-Тунг-Тунг СахурИИ-зависимостьКурганов — нейросетьЧеловек тупее нейросетиЦепочка мыслейТемпература нейросетиMashaGPTУдаление ответов ИИИИ-преступникSiriНовогоднее обращение Путина было ИИKeep4oЭмергентный ИИПоисковики любят творчество ИИRL