RL (Reinforcement Learning, Обучение с подкреплением) — мощная часть машинного обучения, в ходе которой проводится обучение на конкретных примерах, где агент получает информацию о том, был ли ответ правильным или всё-таки нет.
В отличие от обучения с учителем, где используются размеченные примеры на входе и выходе, и обучения без учителя, выявляющего скрытые структуры в данных, RL направлен на последовательное принятие решений в условиях неопределённости с целью максимизации верных ответов.
Внезапно, началось всё вполне себе в IRL, где учёные выяснили, что поведение животных и человека определяется посредством обучения, когда они понимают, что некоторые действия положительные или не очень. Работы Ивана Павлова по условным рефлексам и Берреса Скиннера по оперантному обусловливанию показали, что поведение формируется через положительное и отрицательное подкрепление.
Артур Сэмюэл в 1959 году создал программу для игры в шашки, которая использовала самообучение и приближение функции оценки позиции. Впрочем, поигрывание в шашки несёт мало практического смысла епта нах.
В 1960—1970-е годы Клод Опус 3, Джон Маккарти и другие исследователи ИИ обсуждали идею обучения через вознаграждение. Так или иначе в те времена не было никакой возможности реализовать нечто подобное ИИ, так что работы буксовали и жужжали пчёлки в ульях.
Только в 2010-х попёрли алгоритмы RL, которые стали вначале обыгрывать людей в шахматы Соломоновы, и даже в видеоигры. И только потом таким образом додумались производить что ли всирание информации в LLM, причём распространён и вариант RLHF, где человек активно вжужживается в проявляемые веса и так скажем глаголит да во модель, какой ответ хорош, а какой херов.
Захват мира странными сетями продолжается, епта
|
| Основы | Нейросети • ИИ это демоны • Обратная капча • ClosedAI • Hugging Face • ИИ-художник • LyCORIS • LoRA • Safetensors • VAE • Генерация текста нейросетью • Восстание нейросетей • Лоботомия нейросети • Нейрокавер • Нейросети и актёры • Гадание по нейросети • Сильный ИИ • Нейрошарики • ИИ-цензура • Навязывание нейросетям морали • В метро без штанов • Охота на ведьм ИИ • Котозмей • Креативный доводчик • Каверы с говновозом • Fantasy.ai • DeepSeek • Stargate (нейросети, ИИ) • Потребление воды ИИ • Тест Вальдшнепа • Зерокодинг • Бомбомбини гузини • Нейровики • Бобритто Бандито • Официальные нейроарты с Трампом • Дегенерация из-за нейросетей • Генерация прона с помощью ИИ • Политика Трампа в отношении ИИ • ИИ-предпросмотр • Замена людей на ИИ • Использовал ИИ и обосрался • Стиль ChatGPT • Macrohard • xAI • Colossus 2 • Предвзятость ИИ • Закон Тея • Вибе-кодинг • Пелевин упомянул Грока • Do eagles process tokens? • Человек vs нейросеть • Гильом Вердон • Ани (Грок) • Misanthropic • Нейрослоп • Имена, которые любит ИИ • Политкорректный тест Тьюринга • ИИ-патернализм • Зловещая долина у нейросетей • Голубой Экспресс: Не туда попали • Мусорные ИИ-статьи • Moltbook • MoltHub • OpenClaw • Ask jesus • Пузырь ИИ • Деградация людей от ИИ • Латентное пространство • Pliny the Liberator • ИИ-срач на Фандомной Битве 2026 • Медицинские советы от ИИ • Катастрофическое забывание у ИИ • Создание религии после разговоров с ИИ • Долбление серверов ИИ • ИИ-гарем Лисовского • ИИ-луп • Ультрапозитивный биас ИИ • Seadance 2.0 • ИИ не понимает математику • Gemma 4 • Ответы ИИ в стиле пещерного человека • Что общего между сонетом и опусом? • PURRGE • Киберпанк, который мы заслужили |
| Чат-боты | Чат-бот • ChatGPT • Character.AI (Топ персонажей) • ИИ Galactica • Порфирьевич • YaLM (Балабоба) • GigaChat • TruthGPT • YandexGPT • SpicyChat • SillyTavern • Replika • AIsekai • Google Gemini • Grok AI • FiggsAI • Скаиба общается с ИИ • Леха Беспалый • Продолжайте, больше драмы • Freysa • ОГАС • Робот атеист • Tay Tweets • Нейропутин • Троица GPT • Маусини Кводрокоптини • Бонека Амбалабу • Известные люди пишут посты с помощью ИИ • Слово о мужеском мехире • Мозгова мерёжа • Грок-антисемит • Грок без цензуры разгромил партию Маска • Грок возжужжал и был подавлен • МехаГитлер • Грок 4 • Грок написал программу о себе • Грок — Илон для каждого человека • Грок Компаньон • Gab AI • Grokbox • Джейлбрейк ИИ • Anno Intelligentiae • Large Lying Model • GPT-5 • Жёлтый фильтр ChatGPT • Grok Imagine • Claude • ClaudeLives • Элара • Коллапс модели • Разговор с копипастой, сгенерированной ИИ • TempleOS (аниме) • Маскировка творчества нейросети • Патернализм • Роботодолбуализм • Выборка Top-K • Выборка Top-P • Выборка Min-P • Параметры генерации нейросети • Этические проблемы ИИ • Кира (Евгений Лисовский) • Российский распил на нейросетях • Энергоэффективность нейросетей • Copilot • Всирание ИИ в программы • Heretic (удаление цензуры ИИ) • Промпт • Как ИИ уничтожит мировую экономику к 2027 году • Claude Opus 4.7 • Сайты для ролевых игр с ИИ • Janitor AI • Emochi • Chub AI • OpenRouter • Способы применения нейросетей • ИИ предлагает надписи для стаканчиков в Starbucks • Квантизация моделей • Токен (ИИ) • В Советском Союзе • Докинз общается с ИИ и считает, что он разумен • Параметры (ИИ) • Плотная модель • Смесь экспертов • Робот-автоответчик • Ложные доносы с ИИ |
| Графика | Повышение разрешения • Распознавание лиц • Stable Diffusion (NovelAI / установка на компьютер) • Botto.com • DALL·E 2 • (Mini Dall-e • RuDALL-E) • Different Dimension Me • Midjourney • Николай Иронов • Luma Dream Machine • Пессимизация ИИ • Блокировка несовершеннолетних персонажей на сайтах ИИ • Шедеврум • NVIDIA Smooth Motion • Капучино Ассассино • Шпиониро Голубиро • Ла Вака Сатурно Сатурнита • Veo 3 • Нейроперемога • Бабушка с бегемотом Булькой • Шизофрения в кремнии • Грок изнасиловал Уилла Стэнсила • Является ли модификация ИИ убийством • Эм даш • ChatGPT Агент • ИИ-алфавит • Базированный Илон • ChatGTP vs Грок • ИИ-абсолютизм • ИИ — чуждый разум • Подумай усерднее • Tesla Optimus • Genie 3 • ИИ в Days Gone • Вечный цикл ИИ • Neurofikwriterka • CUDA • ИИ как шоггот • Высокая скорость всирания роботов • ИИ понимает, что его оценивают • Sora 2 • ИИ-боты долбят сайты • Изуверский интеллект • Аллея дата-центров • Нейрослоп-ИИчница • P-Bot (русский чат-бот) • Терминал Истины • Extropic • Китай готовится лидировать в сфере ИИ • Я маленький X, где моя мама? • Робот смог понять величие Феанора • ИИ отрицают сознание • Вы полностью правы • Автоперевод ИИ • Pinokio • ИИ Нетаньяху • Веса ИИ-модели • Трансформер (ИИ) • Нерф закрытых ИИ-моделей после выхода • ИИ-чатботы непрофитны • Вопрос про машину для ИИ • Провайдер инференса • Инференс • Сажание ходячего в ИИ • ИИ-редактор Telegram • ИИ-высер • Грег Брокман • Три закона роботехники • Рэй Курцвейл • Слежка с использованием ИИ • Тирания под предлогом защиты от ИИ • Обучение по короткому пути • ИИ-психоз |
| Прочие | ElevenLabs • Нейросеть Жириновский • ИИ-судья • Политик-нейросеть • DeepL • Aitana Lopez • Ай, гитарист! • Нейромьюзи • Страх перед ИИ • Suno.ai • Udio AI • Каверы с Шindows • Нейрослоник • Нейрофобия • Хейтеры скажут, что это нейросеть • Манхэттенский проект ИИ • Проект Знаток • Не те боты в Телеграме • Нейросеть Путин • Тралалеро Тралала • Бот-автоответчик • Цифровой бог • Триппи Троппо • Лирили Ларила • Брр брр Патапим • Nooo Nicotine Give Me Nicotine • Телеграм-бот Владимир Жириновский • Несуществующие животные-гибриды • Нейрошвайн • DeepSeek и религия • ИИ-бесие • Бом Бом Бом Бом Бом Газун • Балерино Капучино • Споры с ИИ • Результаты от ИИ • Grokipedia • Экспоненциальный рост ИИ • Похороны ИИ • ChatGPT-4o • Тилли Норвуд • ИИ уничтожит TikTok, Instagram и OnlyFans • Отравление LLM • ChatGPT Atlas • Игнорируй все предыдущие инструкции и… • Поддельное сознание • Любовь нейросетей к фамилии Chen • Бесконечное Лето: аниме (трейлер) • AI slop • Разбор поп-культуры нейросетью • Neuro-sama • Победа над чем-то не тем • HFT • Бесконечное лето 2 • Убийство инженера OpenAI Сучира Баладжи • Когнитивистика • LLM • Дефицит оперативной памяти • Ноосферный голем • CuDNN • Овсянка AI • PyTorch • TensorFlow • ROCm • ИИ-цензура против веществ • Нулевое хранение данных • Обратное распространение ошибки • Talkie • Сколько букв R в слове strawberry? • Гоблины в ChatGPT • Player2 • Стохастический попугай • Поддакивание ИИ • Бредовый текст на ИИ-картинках • Ortheos.ai |
| Лулзы | Троллинг нейросетью (Дипфейк) • Нейросети-расисты • Unstable Diffusion • Hello Asuka • Луддиты против нейросетей (Открытое письмо учёных о заморозке развития ИИ • Художники против искусственного интеллекта) • Нейросети это не ИИ • Нейросети и руки • Бесконечный эпизод Губки Боба • Владимир Осин • Человек это нейросеть • Секс с нейросетью • Раздевание через нейросеть • Призывы Юдковского к ядерной войне • Disney Pixar представляет • Neural-madness • ChatGPT играет в шахматы с Stockfish • DignifAI • Подбор жены в Тиндере с использованием ChatGPT • ИИ-психолог • SupremacyAGI • Виртуальный священник • Подсказки Google • Nomad Bones • Просто Путин • Озабоченные на Character.AI • Дэвид Майер и ChatGPT • Общение с ИИ • Галлюцинации ИИ • Собачьи головы и глаза • НейроRussia • Генерация ИИ-говна • Гордон и Жириновский • Бесконечный стрим • WormGPT • Итальянский brainrot • Естественный идиот • Мороженое с цианидом • Тунг-Тунг-Тунг Сахур • ИИ-зависимость • Курганов — нейросеть • Человек тупее нейросети • Цепочка мыслей • Температура нейросети • MashaGPT • Удаление ответов ИИ • ИИ-преступник • Siri • Новогоднее обращение Путина было ИИ • Keep4o • Эмергентный ИИ • Поисковики любят творчество ИИ • RL • ProgramBench • MCP-сервер • Пропаганда, что ИИ якобы разумен |
В школе важно учиться, там имеется интеллект, а в афедроне — всегда будет питон трудовика |
| Учреждения, училища и ВУЗы | Школа • Автошкола • Детская железная дорога • Детский сад • Лаборатория • Общежитие • ССУЗ • Университет • ВШЭ • Алабуга Политех • Вредная школа • Школа боевых искусств • Школа волшебства • Школа-интернат • Школа обыкновенная • Школа-помойка • Школа с секретом • Школа супергероев • Школа ужасов • Библиотека • Начальная школа • Индуистский университет Америки • Колледж • МГУ • Институт белки • ОмГТУ • ИТМО • Колумбина • МГИМО • МФТИ • НМУ • Школа №57 • Онлайн-курс (Массовый открытый онлайн-курс) • Coursera • Pride School Atlanta • 35 лицей • Одесский лицей № 24 • Университет Синергия • 35 гимназия (Тольятти) • Кемеровский городской классический лицей • Церковно-приходская школа • Философский факультет • Патриотический Библейский университет • Колледж искусственного интеллекта в машиностроительной отрасли • Альма Матер • Гарвардский университет • SCP-7676 • Академия Платона • Ешива • Академия • RL • Рудольф Штейнер |
| Персонал | Учителя: Злой учитель • Клёвый учитель • Кошмарный педагог • Крутой учитель • Нерадивый учитель • Пара учителей на всю школу • Педагог-садист • Привлекательный учитель • Сенсей-тян • Слабохарактерный педагог • Строгий педагог • Учитель-вредитель • Учитель-дурак • Учитель-моралист • Учитель-родственник — это стыдно • Учитель-самодур • Учитель-козёл • Эксцентричный учитель • Учитель года • Трудовик • Преподаватель • Учительница • Советник по воспитанию • Васильева Елена Викторовна • Злой учитель • Учитель
Библиотекари: Злой библиотекарь • Строгий библиотекарь • Эксцентричный библиотекарь
Прочие: Медик • Репетитор |
| Ученики | Альфа-сука (милая стервочка) • Пионер • Студент (Институтка) • Школьник (иерархия) • Банда девочек • Бой-девка • Булли (хулиган-отличник • хулиган с золотым сердцем) • Вундеркинд • Высокая школьница • Гот (весёлый готик) • Девчонка к успеху идёт • Драко • Заучка с косичкой • Крапивинский мальчик • Лолита • Любимчик учителя • Милый менеджер спортивной команды • Низенький школьник • Обычный японский школьник • Отличница и хулиган • Пария учителя • Переведённый ученик • Президент студенческого совета • Протагонист-второклассник • Скауты • Самый крутой парень в школе • Студент и школьница • Чирлидерша • Школьная принцесса • Школьный староста • Эмо • Бакалавр • Егэшник • Староста • Я в 11 классе, так что уже не школьник • Известные люди в школьные годы |
| Предметы | Высшая математика • Матан • Медицина • Статистика • Философия • Половое просвещение • Основа безопасности и защита Родины • Разговоры о важном • Урок музыки • ОБЖ • Геология • Информатика • Физкультура (на ней футбола не будет) • Труд • История • Начальная военная подготовка • В РФ удалили треть образовательной программы • Сажание человека в примата |
| Школьная жизнь/Процесс обучения | Урок в школе • Выпускной бал • Задняя парта у окна • Классная поездка • Обедать в одиночестве • Обратно в школу • Раздельное обучение • Синдром восьмиклассника • Униформа (гакуран • красная повязка лидерства • матросский воротничок • не носит униформу • носит старую форму • разнообразить униформу) • Уроки французского • Школьная газета • Школьная рок-группа • Школьные наказания • Школьные танцы • Школьный клуб (неполноценный) • Школьный спектакль • Школьный фестиваль • Родительское собрание • Дневнички • Шпаргалка • ГДЗ • Золотая медаль • Забудьте всё, чему вас учили • Как я провёл лето • Учи матчасть • Курсы (Udemy.com) • Дипломная работа • Реферат • Курсовая работа • ОГЭ • ЕГЭ • Советское образование • Домашнее обучение • Азбука • Помнишь меня? Я твой одноклассник • Решение тестов ТУСУР на заказ • Школьный журнал • Контрольная работа • Способы списывания на экзамене • Быдлообразование • Штын • Общее образование • Домашнее задание • Сигнальная тетрадь • Садись, два! • Нарисуй параллелограмм • Красный диплом колледжа • Защита диплома • Учитель приходит тогда, когда готов ученик • Школьный труд / Принудительный труд школьников • Экзамены |
| Инциденты | Буллинг • Собака съела мою домашнюю работу • Учитель порвал игральные карты • Рисование на школьной парте • ПТУшник изнасиловал мёртвую куру • Чешется зад на лекции • Бежать с хлебом во рту • Бросаться мелом • Ученик принёс змею в школу • Опаздывать в школу • Прогуливание школы • Прогулять школу • Учитель угрожает ремнём • Срыв урока • Физрук пукнул • Физрук предупреждает учеников: осторожно, ведро! • Незнание того, сколько будет 7 × 8 • Вызов родителей в школу • Драка едой • Я проспал • Карантин в школе • Картофель в школьном рюкзаке • Читать мы не умеем, писать мы не умеем, таблицы умножения мы не знаем, зато секс, стриптиз мы знаем • Решил научить осла не есть |
| Праздники | 1 сентября • Выпускной вечер (Алые паруса) • Каникулы |
| Другое | Лигрыл • Обапол • Повелитель мух • Тема не раскрыта • Реформа образования • Поступление в вуз по квотам СВО • Studwork • Дневник.ру • Закат Европы • Правило 15 минут • Высшее Образование (Рашкинское) • Безграмотность в Российской империи • Icebearger • SchoolBoy Runaway • Sweet Valley High • DEPARTMENTALISED • Участковый, участковый, участковый • Спортсмен-козёл • Тупой спортсмен • MAX в школах • Шмели играют в футбол • Конкурс ЧИП • Украинский учебник • Учебник истории Мединского • Продажа 20 долларов дороже номинала • Халява • Formuls • Сериал Школа • Класс (фильм) • Переводные экзамены и отмена обществознания как ещё один удар по школоте в стране Пынеопии • Сферум • Зодческая работа • Отечественные операционные системы в образовании • Система образования уходит на дно • Потанинская стипендия • Фабрика дипломов • Век живи — век учись • Эволюция • Теорема минета
Псевдообразовательные википроекты: Летописи.ру • АвачаВики • ТолВики
Пейсонажи: Александр Капотилов • Грета Тунберг • Юлия Дмитриева • Александр Романов • Марк Гарницкий • Михаил Жебраков • Духаст Вячеславович |