IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     24.12.2025       Статьи

Метрики для задач NLP. Часть 1. Классификация, NER, Кластеризация

В этой статье будет рассказано о популярных метриках для NLP-задач: классификации текста, NER и кластеризации.

     23.12.2025       Статьи

Cтроим масштабируемую архитектуру AI-агентов с FastMCP и LangChain

В статье разбираем, как Model Context Protocol (MCP) и библиотека FastMCP помогают создать чистую, модульную систему: выносим логику в отдельные серверы, управляем контекстом через ресурсы и легко меняем поведение агентов. Показываем на Python и LangChain 1.0, как превратить набор скриптов в масштабируемую фабрику агентов.

     23.12.2025       Статьи

ty: революция в тайп-чекинге

Буквально на днях Astral объявили, что их новый «революционный» тайп-чекер ty переходит в стадию бета-тестирования. А если учитывать, что и uv, и ruff формально тоже всё ещё находятся в бете, то можно считать, что ty уже фактически вышел в релиз. Собственно, о нём и поговорим дальше.

     23.12.2025       Статьи

Инфраструктура для сбора и исследования Steam

Прямого доступа к агрегированным данным у исследователей нет — их необходимо собирать вручную через Steam Web API и сторонние сервисы. В этом проекте мы разработали полноценный программный комплекс для автоматизированного сбора, хранения и анализа данных Steam.

     23.12.2025       Статьи

DDD на пальцах: как перестать проектировать таблицы и начать думать о бизнесе

Cегодня я хочу поговорить о самом непонятном и переоцененном термине в мире архитектуры — Domain-Driven Design (DDD). Я объясню его так, чтобы стало понятно даже джуну, и покажу на реальных примерах, чем он отличается от других подходов.

     22.12.2025       Статьи

Manim: как создавать математические анимации в стиле 3Blue1Brown с помощью Python

Manim — Python-инструменте для создания наглядных математических анимаций в стиле 3Blue1Brown. Разбираемся, как с помощью кода визуализировать уравнения, графики и абстрактные идеи так, чтобы они были понятны коллегам, менеджерам и студентам.

     22.12.2025       Статьи

Хроники тестирования Data Quality

В современных data-процессах ключевую роль играет обеспечение качества данных. Рассмотрим четыре популярных подхода: DBT, SQL, Python (Pandas/SQLAlchemy) и Great Expectations, оценив их эффективность для различных сценариев проверки данных.

     22.12.2025       Статьи

Мониторим и оцениваем качество LLM-приложений с Langfuse

Примерно так выглядит работа с LLM-приложением без инструментов мониторинга: система вроде бы и функционирует, но о ее внутреннем состоянии можно только догадываться.

     22.12.2025       Статьи

Анализ 400k вакансий hh.ru: как мы строили пайплайн и какие тренды нашли

Какие навыки реально нужны в IT? Разбор рынка по данным hh.ru. Мы обработали 393 000 вакансий за 2025 год и делимся результатами: универсальный стек технологий, медианные зарплаты по специальностям и доля удаленки. А еще — техническая реализация нашего open-source проекта для сбора данных.

     21.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Сводка от pythonz 14.12.2025 — 21.12.2025

А теперь о том, что происходило в последнее время на других ресурсах.

     21.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Pech или pyRTOS: вот почему «печка» лучше чем «аналог FreeRTOS»

Pech — это Managed Kernel которая следует концептам Mach 3.0. В 2025 году безопасность важнее ручного управления тактами. Я использую высокоуровневый рантайм для создания математически безопасной среды, где баги памяти устранены на уровне архитектуры. Это то, к чему сейчас стремятся проекты вроде Microsoft Singularity или современные ОС на Rust.

     20.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Visual SLAM (Python)

Я разрабатываю собственную визуальную SLAM-систему, реализованную полностью на языке Python без использования компилируемых C++-библиотек и сложных внешних зависимостей. Проект находится в стадии активной разработки и представляет собой промежуточный итог моего исследования. В этой статье я делюсь своим субъективным опытом разработки системы, описываю принятые решения и возникшие сложности.

     19.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Почему ночных загрузок стало недостаточно: опыт внедрения CDC в М2

В этой статье я расскажу, как мы внедряли Change Data Capture (CDC) с использованием Apache Flink, какие задачи это помогло решить, с какими ограничениями мы столкнулись и почему CDC — полезный, но не универсальный инструмент.

     21.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Моя версия системы автоматического тестирования БК моторов (PHPH)

Я увлекаюсь авиамоделизмом, в основном радиоуправляемыми моделями на бесколлекторных двигателях, но в последние годы данная сфера престала быть нишевой, и поэтому цены на компоненты заметно выросли. Без того дорогие проверенные бренды стали еще дороже, поэтому я все чаще выбираю более бюджетные аналоги с AliExpress или от малоизвестных производителей. Но тут возникает проблема: как убедиться, что дешёвый мотор выдаст заявленные характеристики, и будет надёжным в полёте?

     19.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Строим сервис, который повышает собираемость показаний счетчиков ЖКХ

Передача показаний счётчиков во многих домах всё ещё требует ручных действий. Жильцы откладывают эту задачу, пропускают сроки и получают пени. В статье разберём Python-сервис, который отправляет персонализированные SMS, принимает ответы и подключает голосовой вызов для тех, кто не ответил.

     18.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Использование библиотеки spaCy для поиска сущностей в тексте

В предыдущей статье был приведен пример создания кода проекта для задачи автоматизации обработки данных, в результате чего получилось подготовить нужную информацию по модели данных ЛОЦМАН: PLM. Эти данные планируется использовать для построения механизмов обработки поисковых запросов пользователей к базе ЛОЦМАН:PLM — в частности, для распознавания сущностей в тексте запроса.

     17.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Как в звонках автоматически находить первые признаки выгорания операторов кол-центра

Выгорание операторов — распространенная проблема в кол-центрах. По разным оценкам, текучесть персонала здесь достигает 40–45%, а средний срок работы составляет 8–12 месяцев. Это приводит к дополнительным расходам на обучение, росту нагрузки на команду и снижению качества сервиса. При этом заметные изменения в поведении сотрудников обычно фиксируются слишком поздно — когда проблема уже стала системной

     17.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Ускоряем LLM по максимуму. Как я создал кросс-платформенный Flash Attention

Поэтому представляю вашему вниманию первую и единственную open-source реализацию Flash Attention 2 на Triton с поддержкой Linux и Windows, Turing-Blackwell архитектур (теперь можно работать в Google Colab и Kaggle), гомо и гетерогенных кластеров, опциональным детерминизмом, а также возможностью ручной кастомизации ядер (kernels) для более гибкой настройки под каждую GPU архитектуру отдельно. Более подробно о том как это устроено и не только — далее в статье.

     16.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

dag_generator: лоукод-генерация гетерогенных Airflow DAG

Полноценных open-source-альтернатив, которые закрыли бы все наши потребности, не нашлось. Поэтому мы решили создать свой «мультитул» — low-code-фреймворк для генерации гетерогенных Airflow DAG с незамысловатым названием dag_generator. Цель этой статьи — поделиться опытом внедрения подобного инструмента. Генерация выполняется по старинке, так что про ИИ здесь пока ничего не найдете.

     16.12.2025       Выпуск 627 (15.12.2025 - 21.12.2025)       Статьи

Борьба с дисбалансом классов. Ансамблевые и комбинированные методы

В данной статье мы рассмотрим комбинированные и ансамблевые методы библиотеки Imbalanced Learn.