IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     05.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Как собрать своё зеркало PyPI на nginx за вечер

Чтобы застраховаться, не нужно зеркалировать весь PyPI (это терабайты и постоянная синхронизация). Достаточно поднять лёгкий реверс-прокси на nginx. В этом гайде соберём такой с нуля — с кешированием и прозрачным переключением для pip.

     07.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Сводка pythonz 31.05.2026 — 07.06.2026

А теперь о том, что происходило в последнее время на других ресурсах.

     05.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи
     08.06.2026       Релизы

beautifulsoup4 - 4.15.0

XML/HTML парсер. Скачать можно по ссылке: https://pypi.python.org/pypi/beautifulsoup4/

     08.06.2026       Релизы

aiohttp - 3.14.1

http клиент/сервер для asyncio. Скачать можно по ссылке: https://pypi.python.org/pypi/aiohttp

     05.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Pipeline в машинном обучении: как создавать сложные модели без боли и утечек данных

В ML‑проектах проблемы часто начинаются не с выбора алгоритма, а с предобработки: один трансформер забыли применить к тестовой выборке, другой обучили до кросс‑валидации, третий сломался при передаче проекта коллеге. В статье разберём, как Pipeline в sklearn помогает собрать обработку данных и модель в единый воспроизводимый конвейер, снизить риск data leakage и упростить работу со сложными ML‑сценариями

     05.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Как конечные автоматы помогают сделать агента надежнее и при чем тут pydantic-graph?

Когда пишешь библиотеку, рано или поздно упираешься в движок. Не в красивый внешний интерфейс и не в обёртки, а в ту часть внутри, которая гоняет процесс по состояниям: что-то сгенерировал, проверил, решил, что делать дальше, повторил. Пара флагов, цикл while, большой if посередине, и через месяц вы уже сами не помните, какие переходы там вообще возможны и почему одна из веток недостижима.Недавно я собирал ровно такой движок и наткнулся на библиотеку, которая делает эту работу заметно аккуратнее. Называется pydantic-graph. Про неё почти не пишут, хотя на ней стоит весь pydantic-ai, агентский фреймворк от авторов Pydantic.

     04.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Реверс-инжиниринг карт Heroes of Might and Magic III: Horn of the Abyss + парсер на Python

Мне стало любопытно: смогу ли я распарсить карту HotA и написать такой парсер, который сможет быстро отвечать на вопросы вроде: «Где можно выучить заклинание “Городской портал”?», «Где найти артефакт, например, Чёрный шар?», «Есть ли в тюрьме герой Джелу?» и всё в таком духе.А ещё я решил, что искать в интернете готовые спецификации скучно. 

     04.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова

Дело моё — программы писать, а сходиться им положено с мастеровой грамотой: ГОСТами, СТО, спецификациями. Хочу спросить оракула в писарне про точный пункт — получаю складную околесицу со ссылками на то, чего никто не писал. Тогда я сложил себе doc-rag: местную снасть для извлечения премудрости из собственных свитков. Внутри — устройство, грабли, история про утраченный указатель и попытка рассказать всё это без единого заморского слова.

     04.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Мой личный джун. Часть 1. Учим агента писать код и пользоваться git

Я стал немного более GPU-rich. А это значит, что пора сдуть пыль со старого проекта)В этой части статьи мы создадим необходимую инфраструктуру, напишем простого агента, а также добавим нашему агенту MCP-инструменты.

     03.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Параллельность RNN?

Смотрели итоги прошедшего ICLR? Меня заинтересовала довольно провокационная статья от Эплов — ParaRNN. Казалось бы, параллельность РНН — это их главный недостаток, благодаря которому их заменили трансформеры (в большинстве задач).

     05.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Релизы

redis - 7.4.1

Python клиент для Redis. Скачать можно по ссылке: https://pypi.python.org/pypi/redis/

     05.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Релизы

django-haystack - 3.4.0

Модульный поиск для Django. Скачать можно по ссылке: https://pypi.python.org/pypi/django-haystack/

     02.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Автоматический отбор few_shot примеров для обучения модели

Справочники МТР на крупных предприятиях ‒ это десятки тысяч строк вида «Кабель ВВГнг 3х2.5 кв.мм, серая изоляция, 100м», которые нужно разложить по атрибутам (тип, сечение, длина, цвет изоляции). Дубли, ошибки, разнородные форматы от разных поставщиков, почему это больная тема, а также подходы и методы решения, подробно разобраны в этой статье.

     02.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Как мы проектировали мониторинг Telegram-групп на Telethon: архитектура, правила пользователей и масштабирование

Telegram давно стал не только мессенджером, но и большой средой для сообществ: локальные чаты, профессиональные группы, каналы с комментариями, чаты по аренде, работе, продаже вещей, услугам и так далее. В какой-то момент у нас появилась техническая задача: сделать систему, которая умеет читать сообщения из Telegram-групп, проверять их по пользовательским правилам и отправлять уведомления, если найдено совпадение.

     02.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Whisper или GigaAM для русского ASR в продакшене: три ловушки бенчмарка, которые перевернут ваши выводы

Полгода назад мы публиковали статью про то, как получили 3.3% WER для русского ASR с GigaAM. Замеры шли на пяти TTS-фрагментах из аудиокниг, что подтверждало тезис «специализация бьёт универсальность». С тех пор мы перемерили обе модели на реальных продакшен-записях и попали в три ловушки бенчмарка.Первый замер показал «GigaAM впереди Whisper на 7 pp». На тех же данных, после небольшой чистки, обе модели идут вровень. А на самом шумном клипе с реверберацией Whisper уходит вперёд на 19 pp. Э

     02.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Масштабируемость ML-алгоритмов при увеличении вычислительных ресурсов

В данной статье рассмотрено 5 разных алгоритмов машинного обучения, с наглядным сравнением их скорости работы на разном количестве аппаратных ресурсов.

     02.06.2026       Выпуск 651 (01.06.2026 - 07.06.2026)       Статьи

Что не так с SVG-файлами в Tcl/tk?

В версии tcl/tk-9.0 добавлена возможность создавать изображения image из SVG-файлов (а значит и сохранять их в png-формате). Всё было хорошо до тех пор пока мне для статьи на сайте Tcler's Wiki ни потребовался флаг для кнопки переключения языка интерфейса