IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Учебник под микроскопом. Часть 2. Предобработка текста: регулярки, токенизация и лемматизация на практике

В статье рассмотрен процесс предобработки текстов учебников для последующего анализа и обучения моделей машинного обучения. Показано, как из "сырого" текста, извлечённого из PDF, получить очищенный, структурированный и готовый к обработке набор данных. Основное внимание уделено этапам очистки текста от лишних символов, нормализации регистра, токенизации, лемматизации и удалению стоп-слов, а также POS-теггингу.

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

Асинхронность vs. многопоточность: что выживет в эпоху No GIL?

Тестируем реальные сценарии, измеряем RPS, смотрим на потребление памяти и разбираемся, когда самая разумная стратегия — это просто подождать и обновить Python на free-threading версию. 

     06.10.2025       Выпуск 617 (06.10.2025 - 12.10.2025)       Статьи

NeuTTS Air: открытая модель синтеза речи, которая работает прямо на вашем устройстве

2 октября 2025 года компания Neuphonic представила NeuTTS Air - открытую модель преобразования текста в речь, которая кардинально меняет подход к синтезу голоса. Главная особенность в том, что она работает полностью локально на обычных устройствах без необходимости подключения к интернету или облачным сервисам.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Подсчёт количества запросов к БД в автотестах Django

Не так чтобы часто, но с той самой неприятной регулярностью когда уже забыл как это делал в прошлый раз бывает нужно посчитать сколько запросов к БД гененрирует тот или иной блок кода для django. При этом, мало что лучше закрепляется в памяти, чем очередная неудачная статья на хабре собственного сочиненя. Штош, попробуем совместить полезное с неприятным.

     04.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Создание пользовательских обработчиков для логов в Python

Представьте ситуацию: ваше приложение работает в продакшене, как вдруг происходит критическая ошибка. Вы узнаете о ней только через несколько часов, когда пользователи начинают массово жаловаться. Идёте проверять консоль, а тут всего лишь трассировка стека, которая мало что говорит о проблеме. Из-за кого и когда возникла это ошибка?

     04.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Байесовский анализ и временные ряды в прогнозировании отказов оборудования на примере нефтегазовых компаний

Предсказание отказов оборудования в нефтегазовой отрасли задача, которая напрямую связана с деньгами и безопасностью. Простои установки стоят миллионы, а аварии могут привести к еще большим потерям.

     05.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Сводка от pythonz 28.09.2025 — 05.10.2025

А теперь о том, что происходило в последнее время на других ресурсах.

     03.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Интересные проекты, инструменты, библиотеки

django-markdown-html-field - Django Markdown to HTML Field

Я уже писал статьи о том, как написать MarkdownField для Django с функционалом auto populate. Но теперь я оформил это в самостоятельный пакет для использоавния в Django, которым делюсь с сообществом Django.

     03.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Борьба с дисбалансом классов. Стандартные методы

Этой статьей я начну цикл публикаций по теме борьбы с дисбалансом классов. В первую очередь этот гайд предназначен для ml-разработчиков уровня junior/midle. Мы ознакомимся с различными подходами к решению проблемы дисбаланса классов и проведем их сравнительный анализ на сгенерированной выборке: коснемся метрик качества, встроенных в классификаторы методы борьбы с дисбалансом классов, методы модификации выборки, а также комбинированные техники.

     02.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Как научить робота выходить из лабиринта домино только «глазами»: Jetson Nano + Arduino

Побег Робота из лабиринта. Технологи: Jetson + Arduino + CV. Робот находит выход из лабиринта только с помощью компьютерного зрения. Посмотреть видео и код.

     02.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Видео
     01.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Pytest. Гайд для тех, кто ни разу про него не слышал

Недавно на работе передо мной возникла задача максимально быстро погрузиться в автоматизированное тестирование с ранее мной не использовавшимся фреймворком pytest. Почитав порядка десяти статей на Хабре я понял, что в каждой из статей есть много всего интересного, а чтобы системно погрузиться - необходимо идти читать документацию. Я решил, в привычной мне манере, разобраться и систематизировать самый сок для того, чтобы быстро въехать в суть и важные тонкости положив основу для дальнейшего использования.

     01.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Бэктестер для торговых стратегий на GPU со скоростью просчёта 150 тыс стратегий за 1 секунду

Хочется, чтобы фреймворк для тестирования торговых стратегий был пакетным, гибким, подбирал сразу 10 параметров и просчитывал очень быстро. И вот он ...

     01.10.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Нейросеть на службе бизнеса: от отзыва до инсайтов

В эпоху цифровизации каждый клиентский отзыв — это больше, чем просто слова. Это ценный актив, содержащий информацию о настроениях, скрытых проблемах и возможностях для роста. Однако, как бизнесу эффективно обрабатывать тысячи таких сообщений?

     30.09.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

AI Review: для всех, везде и без боли

Раньше вас ревьюил злой коллега — теперь это делает AI. AI Review — open-source инструмент, который сам проверяет код прямо в CI/CD. Поддерживает OpenAI, Claude, Gemini, GitLab и GitHub. Быстро, честно и без боли.

     30.09.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

DevSecOps за 20 миллионов? Я сделал свой сканер и выложил бесплатно

Я раньше работал обычным безопасником. Кто-то называет таких «ИБшниками», кто-то — «параноиками», кто-то — «тем самым занудой, который мешает жить». 

     29.09.2025       Выпуск 616 (29.09.2025 - 05.10.2025)       Статьи

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

Небольшой рассказ о том, как я начал делать инструмент для локального перевода текстов и файлов, с чего началось, и куда пришло.

     28.09.2025       Выпуск 615 (22.09.2025 - 28.09.2025)       Статьи

Сводка от pythonz 21.09.2025 — 28.09.2025

А теперь о том, что происходило в последнее время на других ресурсах.

     28.09.2025       Выпуск 615 (22.09.2025 - 28.09.2025)       Статьи

CPython — Сборка мусора изнутри, ч.2

В прошлой части этого цикла статей мы рассмотрели, как происходит регистрация объектов в сборщике мусора, когда происходит планирование и вызов сборки мусора. В этой части разберем как запускается сборка мусора, подробно рассмотрим сборку для молодого поколении, затронем механизм подсчета ссылок и какие эффекты могут возникнуть при его работе. 

     27.09.2025       Выпуск 615 (22.09.2025 - 28.09.2025)       Статьи

Создание умных AI-агентов. Часть 3. Даём ИИ руки: работа с инструментами и MCP

В третьей части курса по созданию ИИ‑агентов совершаем революционный скачок: превращаем умных болтунов в настоящих цифровых исполнителей с «руками».Учим агентов самостоятельно работать с файлами, базами данных, API и внешними системами. Больше никаких просьб «пришлите мне файл» — агенты сами найдут данные, проанализируют их и создадут отчёт.