IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Django 6.0: Ключевые функции, критические изменения

В Django 6.0 есть кое-что для вас. Давайте рассмотрим самые важные новые функции и изменения, о которых вам нужно знать.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи
     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

PEP 810: Explicit Lazy Imports (Added)

Черновик предложения по ленивому импорту.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Как мы захотели контролировать SPILL’ы в Greenplum и сделали «Демократизатор»

Представьте: Один неоптимизированный запрос от неопытного коллеги - и вот уже 40 ТБ SPILL-файлов парализуют систему.Срабатывает лимит на уровне Greenplum, запрос завершён. Никто ничего не знает.Создаются заявки, пишутся письма, пользователь недоволен.Это не какая-то выдуманная история, а обычный будний день в большом Greenplum. Вернее, так было раньше.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Как я пытался ускорить анализ 12 000 комментариев с помощью GPU за 50 тысяч, но победил процессор

История о том, как я хотел провести анализ комментариев, а в итоге получил неожиданный, но полезный опыт с локальным AI. Недавно передо мной встала задача собрать все положительные комментарии к моим статьям. Веду их учёт в таблице, и там уже вполне серьёзные цифры — больше 300 строк и свыше 10 тысяч комментариев.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Опыт гуманитария в дообучении LLM с помощью WebUI Text Generation

Продолжаю делиться опытом освоения нейросетей человеком с гуманитарным образованием и без IT-бэкграунда. На этот раз моей целью было разобраться, как происходит дообучение готовых LLM-моделей, как выстраивать процесс, какие использовать данные, модели, настройки и прочее. Зачем мне это понадобилось?

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи
     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

AI Review кода за 30 минут: локальная LLM прямо в CI/CD

Как за полчаса подключить автоматическое ревью кода с помощью AI Review и локальной LLM Ollama прямо в CI/CD — без токенов и VPN.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Паттерны программирования при работе с LLM

LLM - мощный инструмент, но его эффективность в продакшене зависит не от одного «хитрого промпта», а от всей архитектуры: что мы даём модели, как управляем её рассуждением и как проверяем/обрабатываем результат. В этой статье - компактная карта паттернов, разбитая по этапам конвейера: Input -> Reasoning -> Output.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

EDA в Python для новичков: что почитать и где попрактиковаться

Разведочный или исследовательский анализ данных (Exploratory Data Analysis, EDA) — это этап работы с данными, на котором аналитик изучает доступную информацию перед построением сложных аналитических моделей. Это основа работы с данными, которая помогает понять, какая информация доступна и возникнут ли трудности с будущим анализом.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

GGUF: квантизация с калибровкой (imatrix)

Признаюсь, я не большой любитель vLLM, Triton Inference Server и всяких там NeMo, вместо них я предпочитаю ollama вообще и llama.cpp в частности, поскольку придерживаюсь мнения, что 1-2% потери в точности и отсутствие некоторых плюшек - не так важно, по сравнению с удобством деплоя, спекулятивным декодингом, многократным приростом скорости, динамическим оффлодом в память системы и возможностью запускать модели на любом "ведре", навроде древних зионов, андройдофонов, малинок или, скажем, макбуков.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Учебник под микроскопом. Часть 2. Предобработка текста: регулярки, токенизация и лемматизация на практике

В статье рассмотрен процесс предобработки текстов учебников для последующего анализа и обучения моделей машинного обучения. Показано, как из "сырого" текста, извлечённого из PDF, получить очищенный, структурированный и готовый к обработке набор данных. Основное внимание уделено этапам очистки текста от лишних символов, нормализации регистра, токенизации, лемматизации и удалению стоп-слов, а также POS-теггингу.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Асинхронность vs. многопоточность: что выживет в эпоху No GIL?

Тестируем реальные сценарии, измеряем RPS, смотрим на потребление памяти и разбираемся, когда самая разумная стратегия — это просто подождать и обновить Python на free-threading версию. 

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

NeuTTS Air: открытая модель синтеза речи, которая работает прямо на вашем устройстве

2 октября 2025 года компания Neuphonic представила NeuTTS Air - открытую модель преобразования текста в речь, которая кардинально меняет подход к синтезу голоса. Главная особенность в том, что она работает полностью локально на обычных устройствах без необходимости подключения к интернету или облачным сервисам.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Подсчёт количества запросов к БД в автотестах Django

Не так чтобы часто, но с той самой неприятной регулярностью когда уже забыл как это делал в прошлый раз бывает нужно посчитать сколько запросов к БД гененрирует тот или иной блок кода для django. При этом, мало что лучше закрепляется в памяти, чем очередная неудачная статья на хабре собственного сочиненя. Штош, попробуем совместить полезное с неприятным.

     04.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Создание пользовательских обработчиков для логов в Python

Представьте ситуацию: ваше приложение работает в продакшене, как вдруг происходит критическая ошибка. Вы узнаете о ней только через несколько часов, когда пользователи начинают массово жаловаться. Идёте проверять консоль, а тут всего лишь трассировка стека, которая мало что говорит о проблеме. Из-за кого и когда возникла это ошибка?

     04.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Байесовский анализ и временные ряды в прогнозировании отказов оборудования на примере нефтегазовых компаний

Предсказание отказов оборудования в нефтегазовой отрасли задача, которая напрямую связана с деньгами и безопасностью. Простои установки стоят миллионы, а аварии могут привести к еще большим потерям.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Сводка от pythonz 28.09.2025 — 05.10.2025

А теперь о том, что происходило в последнее время на других ресурсах.

     03.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Борьба с дисбалансом классов. Стандартные методы

Этой статьей я начну цикл публикаций по теме борьбы с дисбалансом классов. В первую очередь этот гайд предназначен для ml-разработчиков уровня junior/midle. Мы ознакомимся с различными подходами к решению проблемы дисбаланса классов и проведем их сравнительный анализ на сгенерированной выборке: коснемся метрик качества, встроенных в классификаторы методы борьбы с дисбалансом классов, методы модификации выборки, а также комбинированные техники.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи