Curl cffi

curl_cffi — это попытка прикрутить к Питону мощь и славу curl (точнее, его библиотеки libcurl) через механизм CFFI (C Foreign Function Interface), который позволяет питонячьему скрипту дёргать Си-шные функции, делая вид, что так и было задумано. Главная фишка и причина существования сего творения — возможность прикидываться браузером на уровне TLS-рукопожатия, обходя хитрожопые защиты, которые палят стандартные питонячьи SSL/TLS-стеки за версту.

Зачем и почему?[править]

Представь себе типичную ситуацию: некий школьник или быдлокодер решает накодить скрипт для парсинга котиков (или чего поинтереснее, вроде курсов крипты или цен на аниме-фигурки) с очередного сайтеца. Он берёт свой любимый requests, пишет три строки кода и… получает кукиш с маслом. Сайт, защищённый какой-нибудь вундервафлей типа Cloudflare, вежливо посылает его куда подальше, определив по уникальному отпечатку пальца TLS-хендшейка, что перед ним не хомо сапиенс с Хромом последней версии, а жалкий бот на питоне.

Тут-то на сцену и выходит наш герой — curl_cffi. В отличие от стандартных питоньих библиотек, которые используют свои, зачастую палящиеся реализации TLS (вроде OpenSSL в стандартной комплектации), curl_cffi тащит за собой libcurl. А libcurl, в свою очередь, может быть скомпилирован с использованием тех же TLS-библиотек, что и браузеры (например, BoringSSL, форк OpenSSL от Google, используемый в Chrome). При правильной настройке (или просто удачном стечении обстоятельств и версии библиотеки) curl_cffi может сгенерировать TLS-рукопожатие, неотличимое от браузерного (привет, JA3/JA4 и прочие акронимы из трёх/четырёх букв!).

В результате сервер думает, что к нему ломится обычный юзер, и невозбранно отдаёт контент. Лулз в том, что это вечная игра в кошки-мышки: завтра Cloudflare выкатит новую проверку, послезавтра обновятся браузеры и их отпечатки, и придётся снова обновлять curl_cffi или искать новый, ещё более хитрый велосипед.

Альтернативы и перспективы[править]

Конечно, curl_cffi — не единственный способ борьбы с ветряными мельницами веб-защит. Есть старый добрый Selenium или более модный Playwright, которые запускают полноценный браузер. Но это тяжеловесно, медленно и жрёт память как не в себя. Есть хардкорный pycurl — прямые биндинги к libcurl без CFFI-прослойки, но с ещё более вырвиглазным API. Есть даже попытки патчить стандартные библиотеки или использовать нодовские поделия через subprocess.

Глубокий смысл скрыт в этих неестественных языках
Языки программирования	Промышленные: 1С • BAT • C# • C • C++ • Java • JavaScript (AJAX) • Pascal • Perl • YAML • PHP • Python • Ruby • ABAP • Ассемблер • Васик • Fortran (Профессор) Эзотерические: BrainFuck • HQ9+ • + • Erlang • Forth • Haskell • LISP (My other car) • Prolog • Tcl • ΤΕΧ • Oracle • MySQL • Golang • В++ • Scala • H и Ё • + • Программист-бетонщик
Профессии	Быдлокодер • Программист • Тестировщик • Хакер • Хеллоуворлдщик • IT-звёзды • Программист (существо) • Тернарный оператор • Unreal MCP • Исходный код • Single-Page Application • Gitea • Forgejo • Ceph • IDE • Джуниор • Репозиторий • PostgreSQL • SQLite • JQuery • Буфер • WebGL • Переполнение буфера • Хардкод • Invoke-WebRequest • Скрипт для автоблокировки новых пользователей • Разделение диапазонов • Проверка диапазонов • GeoLite2-Country.mmdb • Objective-C • ProgramBench • Composer 2.5
Методы и стили	Reverse Engineering • Анти-паттерн • Выстрелить себе в ногу • Грязный хак • Код (индусский) • Костыль • Метод научного тыка • Помолясь • Свистелки и перделки • Очередь • Спортивное программирование • Обфускация • Бета-тест • Альфа-тест • Шаблоны • RegReplace • Фреймворк • Быдлокод • Index.php • Охота за жуками • КуМир • Клеточный автомат • Процедурное программирование • Поиск файлов в Unix по содержимому • Petooh • Функция активации нейрона • Перегрузка операторов в Python • Зерокодинг
Средства разработки	Sublime Text • Подсветка синтаксиса кода • Unstable Diffusion • API • PythonTutor • CodeWars • DataCamp • Unity3D • Книжный Python • Malloc • Связный список • SOLID • ООП • Указатель • NULL • WeLang++ • XenonRecomp • Fuse.js • Оптимизация • Тестирование • Ambreon866 • Реверс-инжиниринг • Кроссплатформенность • JSON
Люди	Илья Кантор • Юрий Ключевский • Эдуард Лаас • Эдвард Сноуден • Сеймур Пейперт • Проблема • K!ocky • TypeScript • Отладчик • Бит • Эффективный менеджер (IT) • Tauri • React Native • Windows API • Тип • PyTorch • TensorFlow • Парсер • Node.js • FastAPI • Vue.js • Svelte • Бэкенд • Electron • Broken Object Level Authorization • Маппинг • Джастин Франкель • Hex-редактор • Visual Basic .NET • Next.js • Docker Compose • Node modules • IndexedDB • Dos2unix
Прочее	++i + ++i • Дедлайн • %s • 640 килобайт • CMS • Dummy mode • ЕГГОГ • Foobar • God is real, unless explicitly declared as integer • GOTO • Ifconfig • KISS • RegExp • SICP • sql.ru • Xyzzy • Дискета • Инжалид дежице • КОИ-8 • Лог • Ман • Рекурсия • СУБД • Тест Тьюринга • Умение разбираться в чужом коде • Фаза Луны • Фатальный недостаток • Проблема 2000 • Таймстамп • Кэш • Запись в файл без кэша (Perl) • Танцы с бубном • Кодач • Хук • Curl cffi • Вибе-кодинг • Flutter • Аппликативный оператор • Выбрасывание окон из Windows

Curl cffi

Зачем и почему?[править]

Альтернативы и перспективы[править]

Навигация

Поиск