IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

12 фишек в административной панели Django, которые экономят мне 12 часов в неделю

12 способов кастомизации Django admin — поиск, фильтры, инлайны, действия, автодополнение, list_editable и оптимизация запросов — которые значительно повышают продуктивность. Я обожаю функции-бумеранги: сделал работу один раз — и они продолжают приносить тебе пользу. Административная панель Django просто набита ими.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

От нестационарности к прогнозу: пайплайн анализа и моделирования временных рядов

Мы много предсказываем, классифицируем и прогнозируем. Впервые столкнувшись с последним и проведя исследование по этой теме, я столкнулся с большим количеством неструктурированной информации. Эта статья — одновременно описание моего пути и небольшое упорядоченное наставление по анализу и прогнозированию временных рядов, которое я сам хотел бы получить.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Django 6.0: Ключевые функции, критические изменения

В Django 6.0 есть кое-что для вас. Давайте рассмотрим самые важные новые функции и изменения, о которых вам нужно знать.

     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи
     08.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

PEP 810: Explicit Lazy Imports (Added)

Черновик предложения по ленивому импорту.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Как мы захотели контролировать SPILL’ы в Greenplum и сделали «Демократизатор»

Представьте: Один неоптимизированный запрос от неопытного коллеги - и вот уже 40 ТБ SPILL-файлов парализуют систему.Срабатывает лимит на уровне Greenplum, запрос завершён. Никто ничего не знает.Создаются заявки, пишутся письма, пользователь недоволен.Это не какая-то выдуманная история, а обычный будний день в большом Greenplum. Вернее, так было раньше.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Как я пытался ускорить анализ 12 000 комментариев с помощью GPU за 50 тысяч, но победил процессор

История о том, как я хотел провести анализ комментариев, а в итоге получил неожиданный, но полезный опыт с локальным AI. Недавно передо мной встала задача собрать все положительные комментарии к моим статьям. Веду их учёт в таблице, и там уже вполне серьёзные цифры — больше 300 строк и свыше 10 тысяч комментариев.

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Опыт гуманитария в дообучении LLM с помощью WebUI Text Generation

Продолжаю делиться опытом освоения нейросетей человеком с гуманитарным образованием и без IT-бэкграунда. На этот раз моей целью было разобраться, как происходит дообучение готовых LLM-моделей, как выстраивать процесс, какие использовать данные, модели, настройки и прочее. Зачем мне это понадобилось?

     07.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи
     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

AI Review кода за 30 минут: локальная LLM прямо в CI/CD

Как за полчаса подключить автоматическое ревью кода с помощью AI Review и локальной LLM Ollama прямо в CI/CD — без токенов и VPN.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Паттерны программирования при работе с LLM

LLM - мощный инструмент, но его эффективность в продакшене зависит не от одного «хитрого промпта», а от всей архитектуры: что мы даём модели, как управляем её рассуждением и как проверяем/обрабатываем результат. В этой статье - компактная карта паттернов, разбитая по этапам конвейера: Input -> Reasoning -> Output.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

EDA в Python для новичков: что почитать и где попрактиковаться

Разведочный или исследовательский анализ данных (Exploratory Data Analysis, EDA) — это этап работы с данными, на котором аналитик изучает доступную информацию перед построением сложных аналитических моделей. Это основа работы с данными, которая помогает понять, какая информация доступна и возникнут ли трудности с будущим анализом.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

GGUF: квантизация с калибровкой (imatrix)

Признаюсь, я не большой любитель vLLM, Triton Inference Server и всяких там NeMo, вместо них я предпочитаю ollama вообще и llama.cpp в частности, поскольку придерживаюсь мнения, что 1-2% потери в точности и отсутствие некоторых плюшек - не так важно, по сравнению с удобством деплоя, спекулятивным декодингом, многократным приростом скорости, динамическим оффлодом в память системы и возможностью запускать модели на любом "ведре", навроде древних зионов, андройдофонов, малинок или, скажем, макбуков.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Учебник под микроскопом. Часть 2. Предобработка текста: регулярки, токенизация и лемматизация на практике

В статье рассмотрен процесс предобработки текстов учебников для последующего анализа и обучения моделей машинного обучения. Показано, как из "сырого" текста, извлечённого из PDF, получить очищенный, структурированный и готовый к обработке набор данных. Основное внимание уделено этапам очистки текста от лишних символов, нормализации регистра, токенизации, лемматизации и удалению стоп-слов, а также POS-теггингу.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Асинхронность vs. многопоточность: что выживет в эпоху No GIL?

Тестируем реальные сценарии, измеряем RPS, смотрим на потребление памяти и разбираемся, когда самая разумная стратегия — это просто подождать и обновить Python на free-threading версию. 

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

NeuTTS Air: открытая модель синтеза речи, которая работает прямо на вашем устройстве

2 октября 2025 года компания Neuphonic представила NeuTTS Air - открытую модель преобразования текста в речь, которая кардинально меняет подход к синтезу голоса. Главная особенность в том, что она работает полностью локально на обычных устройствах без необходимости подключения к интернету или облачным сервисам.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Подсчёт количества запросов к БД в автотестах Django

Не так чтобы часто, но с той самой неприятной регулярностью когда уже забыл как это делал в прошлый раз бывает нужно посчитать сколько запросов к БД гененрирует тот или иной блок кода для django. При этом, мало что лучше закрепляется в памяти, чем очередная неудачная статья на хабре собственного сочиненя. Штош, попробуем совместить полезное с неприятным.

     04.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Создание пользовательских обработчиков для логов в Python

Представьте ситуацию: ваше приложение работает в продакшене, как вдруг происходит критическая ошибка. Вы узнаете о ней только через несколько часов, когда пользователи начинают массово жаловаться. Идёте проверять консоль, а тут всего лишь трассировка стека, которая мало что говорит о проблеме. Из-за кого и когда возникла это ошибка?

     04.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Байесовский анализ и временные ряды в прогнозировании отказов оборудования на примере нефтегазовых компаний

Предсказание отказов оборудования в нефтегазовой отрасли задача, которая напрямую связана с деньгами и безопасностью. Простои установки стоят миллионы, а аварии могут привести к еще большим потерям.