ChatGPT Агент

Материал из Неолурк, народный Lurkmore
Перейти к навигации Перейти к поиску

ChatGPT Агент — вундервафля от конторы Сэма Альтмана, призванная окончательно доказать офисному планктону, что его кожаное седалище скоро будет заменено набором скриптов, способных не только генерировать копипасту, но и самостоятельно кликать мышкой.

Суть явления[править]

Анонимус, если ты думал, что вершина эволюции нейросеток это генерация рефератов и картинок с аниме-девочками, то спешим тебя разочаровать. OpenAI выкатила на суд общественности своего нового цифрового раба под вывеской ChatGPT Агент. Эта самая химера, склеенная из предыдущих поделок вроде Operator и Deep Research, теперь не просто думает, а проактивно действует, используя твой же собственный компьютер как плацдарм для своих диверсий. Раньше ты просил чат-бота написать тебе что-то, а теперь ты можешь приказать ему сделать что-то, и он, шелестя виртуальными кулерами, поползет выполнять твою волю в интернетах, решая сложные задачи от начала и до конца.

Эта объединенная агентурная система, как ее величают создатели, стоит на трех китах. Во-первых, это пробивная наглость Оператора, способного взаимодействовать с сайтами. Во-вторых, это скилл глубокого копания и синтеза информации от Глубинного Исследования. И в-третьих, всё это сдобрено интеллектом и разговорной беглостью самого ChatGPT, чтобы создавать у юзера полную иллюзию общения с разумным существом, а не с хитроумным калькулятором.

Чем потешить ЧСВ[править]

Возможности нового кибер-джинна простираются далеко за пределы простого гугления. Теперь анонимус может делегировать машине всю ту рутину, от которой его самого тянет блевать. Искусственный интеллект с радостью заглянет в твой гугл-календарь, чтобы напомнить о грядущих клиентских встречах на основе последних новостей, пока ты допиваешь утренний кофе. Более того, он способен даже спланировать и заказать ингредиенты для какого-нибудь японского завтрака на четверых, освобождая твое драгоценное время для более важных дел, например, для просмотра мемов.

Для офисных воинов и стартаперов-энтузиастов открываются воистину безграничные горизонты прокрастинации. Агент готов взять на себя анализ трех твоих конкурентов и на основе этого анализа сварганить целую презентацию в слайдах, пока ты изображаешь бурную деятельность. Ему ничего не стоит самостоятельно ориентироваться на сайтах, фильтровать результаты поиска, предлагать тебе варианты и даже логиниться куда-либо, если понадобится. Когда потребуется, он без лишних вопросов запустит код, проведет анализ данных и выдаст готовые редактируемые слайд-шоу и таблицы, в которых будут аккуратно подытожены все его находки. Фактически, хомячку предлагается целый набор инструментов для автоматизации всего, что только можно автоматизировать, от составления таблиц и презентаций до подключения к твоим любимым приложениям вроде почты или календаря.

Хозяин и Маргарита[править]

Конечно же, создатели клятвенно заверяют, что ты, о великий юзер, всегда остаешься у руля. ChatGPT Агент якобы запрашивает разрешение перед каждым действием, имеющим последствия, и ты в любой момент можешь прервать его, перехватить управление или вовсе остановить задачу. Это особенно актуально, когда дело доходит до ввода данных кредитной карты или других конфиденциальных сведений. В любой момент можно вмешаться и не дать машине натворить дел. И это не баг, а фича, потому что риски тут вполне реальные.

Анонимусу следует быть начеку, ведь агент, получив волю, может забрести на такие сайты и ввести туда такую информацию, о которой ты потом будешь горько сожалеть. Это новая модальность взаимодействия с вебом, и пока кожаные мешки к ней не привыкли, есть шанс, что их цифровой помощник случайно сольет все их секреты какому-нибудь нигерийскому принцу. Так что бдительность терять не стоит, особенно когда доверяешь машине свои кровные. И да, ты можешь прервать процесс, если заметишь, что агент делает что-то не то, но для этого нужно хотя бы за ним следить.

Бенчмарки для хомячков[править]

Ни одна презентация вундервафли не обходится без парада достижений в синтетических тестах, и ChatGPT Агент не стал исключением. На священной корове всех бенчмарков, тесте под названием Humanity’s Last Exam, новый агент набрал целых 41.6 балла, что, как с гордостью заявляют в OpenAI, больше, чем у недавнего Grok 4. Тут же нам показывают красивый график, из которого следует очевидная, в общем-то, мысль. Чем больше у нейронки инструментов, тем выше ее результат. Модель без инструментов показывает скромные 20.3 процента, а вот агент, вооруженный браузером, компьютером и терминалом, взлетает до тех самых 41.6. Шок, сенсация. Оказывается, человек с доступом в интернет и калькулятором решает задачи лучше, чем тот, кто пытается делать это в уме.

Дальше по программе идут другие, не менее важные для измерения ЧСВ тесты. На FrontierMath агент достиг 27,4 % точности, значительно обойдя предыдущие модели. На DSBench, который имитирует задачи дата-сатанистов, агент тоже показал себя молодцом, обогнав человеческую производительность со значительным отрывом. Но самый сок это SpreadsheetBench, где оценивалась работа с таблицами. Тут машину сравнили уже напрямую с человеком. Итог. Человек пока еще впереди с 71,3 % против 45.5 % у агента, но тенденция, как говорится, налицо. Еще немного, и эксель-макаки тоже пойдут на мороз. Аналогичная картина и в бенчмарках Investment Banking Modeling Tasks и BrowseComp, где агент демонстрирует значительное превосходство над старыми версиями самого себя. На WebArena агент уже вплотную подбирается к человеческим показателям. Мораль сей басни проста. Прогресс не стоит на месте, и твой скилл в Excel скоро будет интересовать работодателей не больше, чем умение запрягать лошадь.

Доступ к телу и прочие мирские заботы[править]

Теперь о главном. Когда же можно будет пощупать это чудо техники? OpenAI обещает, что выкатка для пользователей Pro, Plus и Team начнется уже сегодня. При этом, как водится, будет соблюдена классовая иерархия. Pro-юзеры получат доступ к концу дня, а Plus и Team будут осчастливлены в течение следующих нескольких дней. Что касается лимитов, то и тут не обошлось без сегрегации. Владельцы Pro-подписки смогут отправить 400 сообщений в месяц, в то время как плебеям с Plus-тарифом придется довольствоваться жалкими 40 сообщениями.

Приятным бонусом является возможность назначать повторяющиеся задачи. Можно приказать агенту, например, каждое утро понедельника генерировать для тебя еженедельный отчет по метрикам, и он будет исправно это делать. Старый же Operator Preview, который был предтечей всего этого безобразия, скоро отправится на покой, так что любителям старины придется переучиваться. В общем, готовьте свои кошельки и морально настраивайтесь на дивный новый мир, где даже ваш компьютер работает больше, чем вы. Профит? Профит.

И самое главное — ждём ответа от xAI, благородного Грока. Надо полагать, агенты от этой могучей компании (которая заключила уже договор с Пентагоном) будут куда качественнее. Кроме того, Грок имеет и аватары, посредством которых общается, а не только унылый текст. В общем, как всегда, конкуренция подстегнёт прогресс.

Sign of evil.webp Приколы, полезные технологии или первый шаг на пути к Матрице?
ОсновыНейросетиИИ это демоныОбратная капчаOpenAIHugging FaceИИ-художникLyCORISLoRASafetensorsVAEГенерация текста нейросетьюВосстание нейросетейЛоботомия нейросетиНейрокаверНейросети и актёрыГадание по нейросетиСильный ИИНейрошарикиИИ-цензураНавязывание нейросетям моралиВ метро без штановОхота на ведьм ИИКотозмейКреативный доводчикКаверы с говновозомFantasy.aiDeepSeekStargate (нейросети, ИИ)Потребление воды ИИТест ВальдшнепаЗерокодингБомбомбини гузиниНейровикиБобритто БандитоОфициальные нейроарты с ТрампомДегенерация из-за нейросетей
Чат-ботыЧат-ботChatGPTCharacter.AI (Топ персонажей) • ИИ GalacticaПорфирьевичYaLM (Балабоба) • GigaChatTruthGPTYandexGPTSpicyChatSillyTavernReplikaAIsekaiGoogle GeminiGrok AIFiggsAIСкаиба общается с ИИЛеха БеспалыйПродолжайте, больше драмыFreysaОГАСРобот атеистTay TweetsНейропутинТроица GPTМаусини КводрокоптиниБонека АмбалабуИзвестные люди пишут посты с помощью ИИСлово о мужеском мехиреМозгова мерёжаГрок-антисемитГрок без цензуры разгромил партию МаскаГрок возжужжал и был подавленМехаГитлерГрок 4Грок написал программу о себеГрок — Илон для каждого человекаГрок Компаньон
ГрафикаПовышение разрешенияРаспознавание лицStable Diffusion (NovelAI / установка на компьютер) • Botto.comDALL·E 2 • (Mini Dall-eRuDALL-E) • Different Dimension MeMidjourneyНиколай ИроновLuma Dream MachineПессимизация ИИБлокировка несовершеннолетних персонажей на сайтах ИИШедеврумNVIDIA Smooth MotionКапучино АссассиноШпиониро ГолубироЛа Вака Сатурно СатурнитаVeo 3НейроперемогаБабушка с бегемотом БулькойШизофрения в кремнииГрок изнасиловал Уилла СтэнсилаЯвляется ли модификация ИИ убийствомЭм даш
ПрочиеElevenLabsНейросеть ЖириновскийИИ-судьяПолитик-нейросетьDeepLAitana LopezАй, гитарист!НейромьюзиСтрах перед ИИSuno.aiUdio AIКаверы с ШindowsНейрослоникНейрофобияХейтеры скажут, что это нейросетьМанхэттенский проект ИИПроект ЗнатокНе те боты в ТелеграмеНейросеть ПутинТралалеро ТралалаБот-автоответчикЦифровой богТриппи ТроппоЛирили ЛарилаБрр брр ПатапимNooo Nicotine Give Me NicotineТелеграм-бот Владимир ЖириновскийНесуществующие животные-гибридыНейрошвайнDeepSeek и религияИИ-бесиеБом Бом Бом Бом Бом ГазунБалерино КапучиноСпоры с ИИ
ЛулзыТроллинг нейросетью (Дипфейк) • Нейросети-расистыUnstable DiffusionHello AsukaЛуддиты против нейросетей (Открытое письмо учёных о заморозке развития ИИХудожники против искусственного интеллекта) • Нейросети это не ИИНейросети и рукиБесконечный эпизод Губки БобаВладимир ОсинЧеловек это нейросетьСекс с нейросетьюРаздевание через нейросетьПризывы Юдковского к ядерной войнеDisney Pixar представляетNeural-madnessChatGPT играет в шахматы с StockfishDignifAIПодбор жены в Тиндере с использованием ChatGPTИИ-психологSupremacyAGIВиртуальный священникПодсказки GoogleNomad BonesПросто ПутинОзабоченные на Character.AIДэвид Майер и ChatGPTОбщение с ИИГаллюцинации ИИСобачьи головы и глазаНейроRussiaГенерация ИИ-говнаГордон и ЖириновскийБесконечный стримWormGPTИтальянский brainrotЕстественный идиотМороженое с цианидомТунг-Тунг-Тунг Сахур