IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     10.12.2025       Статьи

Multi-API Ensemble: 95% точности транскрипции региональных топонимов

В статье полный разбор архитектуры, алгоритмы scoring, примеры кода и расчёт экономики.Один STT-сервис дал 60-70% точности на специфической лексике (топонимы, названия улиц, профессиональные термины). Два сервиса параллельно + взвешенное голосование + AI-fusion для спорных случаев дали 95%+ точности. Время обработки 5-8 секунд.

     10.12.2025       Статьи

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

От «обезьяньей» работы к Smart-анализу: как правильно готовить данные для моделей.Что такое Exploratory Data Analysis и как избежать основных ошибок при его выполнении.

     10.12.2025       Статьи

Возможное использование Rust в CPython

Python core developers are actively discussing the introduction of Rust in the CPython code base, starting with optional extension modules and possibly going from there. This post covers the discussion and pros and cons of the idea.

     09.12.2025       Статьи

Generalized Propensity Score: как оценить эффект от непрерывного воздействия без A/B-теста

В прошлом квартале мы задались вопросом: как оценить эффект от времени, которое пользователь проводит в нашем разделе, на Retention Rate (RR)? Казалось бы, решение очевидное: провести A/B-тест, но на поверку всё оказалось не так просто. В статье разберем, как у нас получилось определить эффект, с какими сложностями столкнулись в процессе и как нам помог метод Generalized Propensity Score.

     08.12.2025       Статьи

Как я с DeepSeek писал информационную систему (электронный журнал) для образовательного центра за пару дней

В прошлых материалах я упоминал, что работаю преподавателем в центре для одарённых школьников.
Центров этих в районе десятка по стране. И до этого года все они работали на базе общей информационной системы.

     08.12.2025       Статьи

Реализуем компьютерное зрение на практике

На тему компьютерного зрения есть множество различных публикаций, которые в основном рассказывают о применении этой технологии в разных отраслях. Однако, зачастую публикации содержат лишь общую информацию о том, что реализовано и для каких задач, но при этом отсутствует описание того, как это можно сделать.

     07.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Реальный кейс настройки Pod Autoscaling в k8s с точки зрения разработчика

На носу 2026 год, а я хочу поделиться своим путешествием по переводу приложения на инфраструктуру Kubernetes. Самой сложной и интересной частью была настройка автоскейлинга. Не слишком ли заезженная тема? Думаю нет, потому что я буду рассказывать именно с позиции разработчика приложения, а не девопса. Мне повезло, я без понятия как это всё настраивается. Я буду рассказывать как это всё работает. Конфигов кубера будет минимум, рассуждений и погружений в метрики максимум. В конце оставил TL;DR. Поехали?

     07.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Сводка от pythonz 30.11.2025 — 07.12.2025

А теперь о том, что происходило в последнее время на других ресурсах.

     07.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Чего нам стоит перевод фильма AI построить

Большинство фильмов идут на английском или испанском языке. И тут пришла в голову мысль, "а чтобы нам не использовать ИИ для перевода фильмов", к тому же множество компаний уже предлагают подобные решения. Но мне было ещё интересно изучить этот вопрос и пройти весь путь самим.

     05.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Xkcd: Python Environment (2018)

С poetry/uv легче не особо стало

     05.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Токенизация, как ключ к языковым моделям для низкоресурсных языков

Хочу поделиться своими наблюдениями о том, как статистические алгоритмы извлекают грамматику из текстов.

     05.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

marimo — реактивный аналог Jupyter Notebook

Рассматривается фреймворк marimo, названной в честь аквариумной водоросли, изображенной на заставке к статье. marimo позволяет работать с блокнотами — текстовыми файлами Python, ячейки блокнотов представляют собой декорированные функции Python.

     04.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Мониторинг SSSD через D-Bus: создаем собственный Ansible-модуль вместо sssctl

Сегодня хочу поделиться опытом того, как я отказался от стандартной утилиты мониторинга SSSD в пользу прямого общения с демоном через D-Bus и создал полнофункциональный Ansible-модуль.

     04.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A/B-тестирования

Наша модель основана на классической архитектуре Bidirectional Encoder Representations from Transformers (BERT), улучшенной под задачи и проблемы, с которыми сталкивается маркетплейс.

     04.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Контроль качества переводов на основе ИИ

А вы задумываетесь иногда, что вот хочется что-то сделать такое, чтобы как-то выбиться из общей массы разработчиков? Сейчас придумаю идею, реализую, стану зарабатывать много денег? Все же так думают? Или только я один.Да вот поэтому я и делаю постоянно какие-то проекты. И да, все они простые и не выдающиеся, но, наверное, главное — не унывать. Утешаю я себя так.

     04.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи
     04.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Дифференциальная приватность в ML

Сегодня поговорим в коротком формате о защите данных при обучении моделей, а именно в процессе обучения. Никому не понравится, если ваша нейросеть вдруг выдаст чужие паспортные данные или медицинские записи, правда? А ведь модели машинного обучения иногда склонны запоминать кусочки обучающего набора.

     03.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

Автоматизируем машинное обучение с помощью ИИ-агентов

Решая соревнования на Kaggle начинаешь замечать паттерн. Baseline сделать просто: загрузить данные, запустить CatBoost или LightGBM, получить baseline метрику. Это занимает полчаса. Но чтобы попасть в топ решений, нужно перепробовать десятки вариантов препроцессинга, сотни комбинаций фичей и тысячи наборов гиперпараметров.

     03.12.2025       Выпуск 625 (01.12.2025 - 07.12.2025)       Статьи

SFT vs RL: Сравнение методов настройки LLM для задач программирования и игровых сред

В современной разработке AI-агентов возникает необходимость адаптации больших языковых моделей (LLM) для решения специфических задач, требующих не просто генерации текста, а выполнения последовательных действий с рассуждениями. В этой статье мы рассмотрим и сравним два основных подхода к настройке моделей: Supervised Fine-Tuning (SFT) и Reinforcement Learning (RL), используя библиотеку TRL (Transformer Reinforcement Learning) от Hugging Face.