IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     09.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

ReVu — Open Source AI-ревьюер для ваших Pull Request

Так родился проект ReVu — self-hosted инструмент для автоматического код-ревью в Pull Request с помощью ИИ. Он универсален, легко кастомизируется и не требует доверять исходный код внешним платформам.

     09.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Как мы сделали LLM-сервис, который понимает буровые сводки

Мы собрали 507 PDF‑файлов (всего 14 678 страниц) и выделили 23 типа отчётов по признаку компании и структуры.
Но традиционные подходы: ручной ввод, регулярки, rule‑based и классический NLP — оказались или неэффективными, или нежизнеспособными.
Тогда я обратился к LLM

     09.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Вышел Python 3.14. Насколько он быстр?

В ноябре 2024 года я написал пост «Действительно ли Python такой медленный?», в котором протестировал множество версий Python и отметил стабильный прогресс производительности языка.Сегодня девятое октября 2025 года, прошла всего пара дней после официального релиза Python 3.14. Давайте снова запустим бенчмарки, чтобы проверить, насколько быстра новая версия Python!Примечание: если вам неинтересны таблицы и графики и вы хотите просто прочитать мои выводы, сразу переходите к концу статьи.

     09.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Регулярная катастрофа и как её избежать. Подход к регулярным выражениям

В свободное время занимаюсь дискретной математикой, поэтому обожаю регулярные выражения — они по сути довольно близки к предмету моих интересов и делают код удобноваримее. В этой статье хочу рассказать о математике регулярных выражений и их интересной особенности, которая возникает внезапно

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

12 фишек в административной панели Django, которые экономят мне 12 часов в неделю

12 способов кастомизации Django admin — поиск, фильтры, инлайны, действия, автодополнение, list_editable и оптимизация запросов — которые значительно повышают продуктивность. Я обожаю функции-бумеранги: сделал работу один раз — и они продолжают приносить тебе пользу. Административная панель Django просто набита ими.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

От нестационарности к прогнозу: пайплайн анализа и моделирования временных рядов

Мы много предсказываем, классифицируем и прогнозируем. Впервые столкнувшись с последним и проведя исследование по этой теме, я столкнулся с большим количеством неструктурированной информации. Эта статья — одновременно описание моего пути и небольшое упорядоченное наставление по анализу и прогнозированию временных рядов, которое я сам хотел бы получить.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Django 6.0: Ключевые функции, критические изменения

В Django 6.0 есть кое-что для вас. Давайте рассмотрим самые важные новые функции и изменения, о которых вам нужно знать.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи
     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

PEP 810: Explicit Lazy Imports (Added)

Черновик предложения по ленивому импорту.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Как мы захотели контролировать SPILL’ы в Greenplum и сделали «Демократизатор»

Представьте: Один неоптимизированный запрос от неопытного коллеги - и вот уже 40 ТБ SPILL-файлов парализуют систему.Срабатывает лимит на уровне Greenplum, запрос завершён. Никто ничего не знает.Создаются заявки, пишутся письма, пользователь недоволен.Это не какая-то выдуманная история, а обычный будний день в большом Greenplum. Вернее, так было раньше.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Как я пытался ускорить анализ 12 000 комментариев с помощью GPU за 50 тысяч, но победил процессор

История о том, как я хотел провести анализ комментариев, а в итоге получил неожиданный, но полезный опыт с локальным AI. Недавно передо мной встала задача собрать все положительные комментарии к моим статьям. Веду их учёт в таблице, и там уже вполне серьёзные цифры — больше 300 строк и свыше 10 тысяч комментариев.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Опыт гуманитария в дообучении LLM с помощью WebUI Text Generation

Продолжаю делиться опытом освоения нейросетей человеком с гуманитарным образованием и без IT-бэкграунда. На этот раз моей целью было разобраться, как происходит дообучение готовых LLM-моделей, как выстраивать процесс, какие использовать данные, модели, настройки и прочее. Зачем мне это понадобилось?

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи
     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

AI Review кода за 30 минут: локальная LLM прямо в CI/CD

Как за полчаса подключить автоматическое ревью кода с помощью AI Review и локальной LLM Ollama прямо в CI/CD — без токенов и VPN.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Паттерны программирования при работе с LLM

LLM - мощный инструмент, но его эффективность в продакшене зависит не от одного «хитрого промпта», а от всей архитектуры: что мы даём модели, как управляем её рассуждением и как проверяем/обрабатываем результат. В этой статье - компактная карта паттернов, разбитая по этапам конвейера: Input -> Reasoning -> Output.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

EDA в Python для новичков: что почитать и где попрактиковаться

Разведочный или исследовательский анализ данных (Exploratory Data Analysis, EDA) — это этап работы с данными, на котором аналитик изучает доступную информацию перед построением сложных аналитических моделей. Это основа работы с данными, которая помогает понять, какая информация доступна и возникнут ли трудности с будущим анализом.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

GGUF: квантизация с калибровкой (imatrix)

Признаюсь, я не большой любитель vLLM, Triton Inference Server и всяких там NeMo, вместо них я предпочитаю ollama вообще и llama.cpp в частности, поскольку придерживаюсь мнения, что 1-2% потери в точности и отсутствие некоторых плюшек - не так важно, по сравнению с удобством деплоя, спекулятивным декодингом, многократным приростом скорости, динамическим оффлодом в память системы и возможностью запускать модели на любом "ведре", навроде древних зионов, андройдофонов, малинок или, скажем, макбуков.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Учебник под микроскопом. Часть 2. Предобработка текста: регулярки, токенизация и лемматизация на практике

В статье рассмотрен процесс предобработки текстов учебников для последующего анализа и обучения моделей машинного обучения. Показано, как из "сырого" текста, извлечённого из PDF, получить очищенный, структурированный и готовый к обработке набор данных. Основное внимание уделено этапам очистки текста от лишних символов, нормализации регистра, токенизации, лемматизации и удалению стоп-слов, а также POS-теггингу.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Асинхронность vs. многопоточность: что выживет в эпоху No GIL?

Тестируем реальные сценарии, измеряем RPS, смотрим на потребление памяти и разбираемся, когда самая разумная стратегия — это просто подождать и обновить Python на free-threading версию.