IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python

     08.04.2025       Статьи

Tail-calling: разбираемся в новом интерпретаторе в CPython

В последнее время в моём инфополе появилось много шума вокруг нового типа интерпретатора в Python: tail-calling. Я посмотрел PR на Github, из которого понял, что [[clang::musttail]] должен ускорить рантайм на 5%. Ещё я почитал Соболева, но понял только то, что эта инструкция генерирует вызов метода в asm-коде как jmp, а не call, то есть экономит один стэк-фрейм — посмотреть можно тут. Но почему эти инструкции в данном случае эквивалентны и сработают в CPython — непонятно. Так что давайте разбираться вместе!

     07.04.2025       Статьи
     07.04.2025       Статьи

«Клюква» — автоматизация документации проектов на Python

Сегодня хочу рассказать вам о своем сервисе «Клюква».«Развесистая клюква» или просто «Клюква» в общем виде означает ложные или искаженные представления о чем‑либо. Как раз здесь мы приходим к написанию документации. К сожалению, составить и поддерживать документацию в актуальном состоянии — это проблема. Скорее всего проблема в том числе и в вашей компании.

     07.04.2025       Статьи

Геопространственная обработка признаков

Основная задача обработки признаков — преобразовать данные в числовой вид, потому что ML-модели могут работать только с числами. Геопространственный контекст добавляет слои смысла: например, расположение кафе в центре города или на окраине может влиять на посещаемость сильнее, чем его меню. Представьте, что моделируете спрос на такси — координаты точек подачи станут важнее времени суток, если рядом метро закрывается на ремонт.

     06.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Как я делал голосового ассистента на NLP и не сошел с ума

Голосовые ассистенты давно перестали быть просто игрушкой — теперь это полноценные цифровые помощники, которые умеют общаться, искать информацию и даже шутить (иногда лучше некоторых людей). В этой статье разберём, как собрать своего кастомного ассистента с нуля на Python, используя современные NLP-инструменты. Без Siri, без Alexa, всё своё, родное.

     07.04.2025       Статьи

Конвейер машинного обучения для классификации рукописных цифр MNIST с использованием TensorFlow Extended (TFX)

В рамках данной статьи будет рассмотрено построение конвейера машинного обучения для классификации рукописных цифр из базы данных MNIST с использованием фреймворка TensorFlow и TFX, а также мониторинг процесса обучения с помощью TensorBoard и выпуск модели с автоматической генерацией к ней API с помощью TensorFlow Model Server.

     06.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Сводка от pythonz 30.03.2025 — 06.04.2025

А теперь о том, что происходило в последнее время на других ресурсах.

     05.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи
     06.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

ReCAPTCHA Enterprise: подробный разбор способы распознавания и варианты обхода, какие решатели капчи существуют

Современные сервисы (вебсайты) повсеместно ставят для защиты капчу, усложняя жизнь разработчикам, SEO-специалистам и автоматизаторам (хотя изначально цель не в том, чтобы насолить автоматизаторам, а в том, чтобы минимизировать чрезмерную нагрузку на ресурс от таких вот ребят). Среди большого количества капч особняком стоит Google reCAPTCHA Enterprise – это одна из самых продвинутых систем защиты от ботов в этой линейке.

     04.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Troubleshooting is a Lifestyle 😎

Systematically enhance Django troubleshooting by leveraging built-in indicators, error reporting, and extensible tools like the Debug Toolbar to isolate and resolve issues.

     04.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Разработка Python-скрипта с live-счётчиком подписчиков для сайта

На своем личном сайте я отображаю «живой» счетчик общего количества подписчиков на различных платформах: LinkedIn, GitHub, YouTube, Instagram, Twitter, Medium и Facebook. Я стараюсь геймифицировать социальные сети для себя, и точный подсчет подписчиков и данных играет ключевую роль в достижении этой цели.

     03.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Как создать инструмент для DQ только на Python и Airflow?

В этой статье я расскажу, как мы создали самописный инструмент и библиотеку для проверок качества данных, используя только Python и Airflow, и какую пользу это принесло команде.

     03.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Taigram: универсальная клавиатура и исключения

Продолжаем рассказывать о разработке нашего Open Source проекта Taigram.Taigram - это Open Source Self-Hosted решение по отправке уведомлений о событиях из менеджера управления проектами Taiga в Telegram.

     03.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Настраиваем контекст Copilot: что работает, а что нет

Недавно мы разбирались, как писать код с Cursor. Знать про настройку LLM необходимо всем, кто профессионально использует нейросети в своей работе. Предлагаем перевод еще одной статьи Романа Иманкулова. Автор исследовал GitHub Copilot, чтобы разобраться в составлении инструкций по кодированию и, таким образом, повлиять на предложения, которые генерирует Copilot.

     03.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

AI в работе технического писателя

В этой статье я расскажу, как AI помог мне справиться с рабочей рутиной — от генерации toctree до отладки сборки Sphinx-документации. Всё это — на реальных задачах. Я постаралась собрать побольше примеров из личного опыта. Надеюсь, не слишком много.

     06.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи
     03.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Замена Langchain, как OpenAI Agents SDK справляется с глубоким поиском?

Агенты супер багованы. В своих проектах в компании мы заметили, что Langchain стал уж слишком баговым. В мультиагентных системах агенты зачастую циклятся, так как не понимают, когда они выполнили финальное действие, не вызывают друг друга когда надо, или же просто возвращают данные в битом формате JSON. Короче говоря, создать агентную систему стало не так то просто, и мы даже стали задумываться об упрощении систем, избавляясь от кучи агентов. И вот неделю назад OpenAI обновили SDK для создания агентов, а еще выкатили доступ к новым тулзам по API. Ну и я пошел тестить.

     03.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Автоматизируем пентест с помощью Python

Тестирование на проникновение всегда ограничено во времени. Если черные хакеры (или просто хакеры) могут потратить недели и месяцы на проведение APT атаки, то белые хакеры не могут позволить себе такую роскошь. Есть договор на проведение пентеста и в этом договоре четко указаны сроки.

     02.04.2025       Выпуск 590 (31.03.2025 - 06.04.2025)       Статьи

Мы взломали Google Gemini и скачали его исходный код (частично)

В 2024 году мы выпустили пост We Hacked Google A.I. for $50,000, в котором говорилось, как наша группа в составе Рони «Lupin» Карта (это я), Джозефа «rez0» Тэкера и Джастина «Rhynorater» Гарднера поехала в 2023 году в Лас-Вегас, чтобы искать уязвимости Gemini на проводимом Google мероприятии LLM bugSWAT. В этом году мы повторили нашу поездку…