IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     02.06.2026       Статьи

Автоматический отбор few_shot примеров для обучения модели

Справочники МТР на крупных предприятиях ‒ это десятки тысяч строк вида «Кабель ВВГнг 3х2.5 кв.мм, серая изоляция, 100м», которые нужно разложить по атрибутам (тип, сечение, длина, цвет изоляции). Дубли, ошибки, разнородные форматы от разных поставщиков, почему это больная тема, а также подходы и методы решения, подробно разобраны в этой статье.

     02.06.2026       Статьи

Как мы проектировали мониторинг Telegram-групп на Telethon: архитектура, правила пользователей и масштабирование

Telegram давно стал не только мессенджером, но и большой средой для сообществ: локальные чаты, профессиональные группы, каналы с комментариями, чаты по аренде, работе, продаже вещей, услугам и так далее. В какой-то момент у нас появилась техническая задача: сделать систему, которая умеет читать сообщения из Telegram-групп, проверять их по пользовательским правилам и отправлять уведомления, если найдено совпадение.

     02.06.2026       Статьи

Whisper или GigaAM для русского ASR в продакшене: три ловушки бенчмарка, которые перевернут ваши выводы

Полгода назад мы публиковали статью про то, как получили 3.3% WER для русского ASR с GigaAM. Замеры шли на пяти TTS-фрагментах из аудиокниг, что подтверждало тезис «специализация бьёт универсальность». С тех пор мы перемерили обе модели на реальных продакшен-записях и попали в три ловушки бенчмарка.Первый замер показал «GigaAM впереди Whisper на 7 pp». На тех же данных, после небольшой чистки, обе модели идут вровень. А на самом шумном клипе с реверберацией Whisper уходит вперёд на 19 pp. Э

     02.06.2026       Статьи

Масштабируемость ML-алгоритмов при увеличении вычислительных ресурсов

В данной статье рассмотрено 5 разных алгоритмов машинного обучения, с наглядным сравнением их скорости работы на разном количестве аппаратных ресурсов.

     02.06.2026       Статьи

Что не так с SVG-файлами в Tcl/tk?

В версии tcl/tk-9.0 добавлена возможность создавать изображения image из SVG-файлов (а значит и сохранять их в png-формате). Всё было хорошо до тех пор пока мне для статьи на сайте Tcler's Wiki ни потребовался флаг для кнопки переключения языка интерфейса

     01.06.2026       Статьи

PewDiePie выложил в open source Odysseus — персональный AI-хаб для локальной работы

Блогер PewDiePie выпустил Odysseus — self-hosted AI workspace, который он позиционирует как локальную альтернативу интерфейсам ChatGPT и Claude. Проект объединяет чат с моделями, AI-агента с доступом к файлам и shell, систему памяти и навыков, deep research, редактор документов, email-триаж, заметки, задачи и календарь. Главная ставка — не просто на удобство, а на приватность

     01.06.2026       Статьи

Qwen3.5 на двух V100, reverse SSH вместо Cloudflare в Telegram Mini App: собираю AI-репетитора английского

У меня в углу комнаты стоит сервер с двумя Tesla V100 32GB. Параллельно я в очередной раз пробовал заниматься английским — Simpler, Doalingo, ещё пара продуктов. Хорошие, но мне не подходил формат: я хотел сценарий «открыл телефон дома на семь минут, поговорил, закрыл». Без расписания, без камеры, без поиска тьютора, который понимает мой акцент с пятого раза.Сошлось.

     01.06.2026       Статьи

A2A изнутри: как AI-агенты из разных сервисов договариваются друг с другом

У вас работает AI-агент. У соседней команды — свой, на другом фреймворке, в другом сервисе. Рано или поздно вашему агенту понадобится позвать их агента: «сходи найди факты, я подожду, дальше сам». Казалось бы — обычный HTTP-запрос, и дело с концом.А дело не с концом. Чужой агент — это не ручка, которая отдаёт число за 50 мс: он думает минутами, переспрашивает посреди работы, отваливается по таймауту, а результат хочет отдавать потоком. Н

     31.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Тегирование людей на изображениях и Генерация заголовков для видеороликов

Представьте ситуацию: вы только что вернулись из (заслуженного) отпуска с друзьями и, конечно, сделали множество фотографий. Вы хотите отправить друзьям фото с ними. Но как сделать это эффективно? Можно просмотреть фотографии вручную и отметить каждого друга отдельно. Но вы только вернулись из отпуска, ваш электронный почтовый ящик переполнен, и на просмотр фото совсем нет времени. Как же быть?

     30.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

UAV Human Detector

В статье рассматривается один из компонентов системы управления БЛА для поисково-спасательных работ — обнаружение людей на изображениях с бортовой камеры. Описан процесс выбора датасета, подготовки данных, обучения модели YOLOv8 и оценки её качества на тестовой выборке. Также приведены полученные метрики, примеры работы модели и обсуждаются возможные направления дальнейшего повышения точности обнаружения людей.

     29.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Заброшенные репозитории на GitHub. Какие языки теряют разработчиков и когда код перестают обновлять

GitHub постепенно превращается в кладбище старого кода. Мы сравнили тысячи репозиториев и посмотрели, какие языки быстрее теряют активность, а где экосистема всё ещё растёт.

     29.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Трансформер в on-premise AppSec: как мы встроили ML-модель для классификации секретов в продукт без GPU

Рассказываем, как мы интегрировали CodeBERT-based модель классификации секретов в production-продукт с жёсткими ограничениями по железу, сократив время инференса с 320 до 90 секунд и размер модели с ~600 до ~130 МБ — без дискретных ускорителей и тяжёлых зависимостей.

     29.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Ранжируем треки с помощью TRIBE и RBF

Ощущение — нравится трек или нет, хочется ли его переслушать возникает во время обработки звука мозгом. Поэтому вместо того, чтобы напрямую предсказывать «качество» музыки по спектрограммам или эмбеддингам, можно построить промежуточное представление: сначала оценить, какие паттерны активности коры вызывает аудио, а затем уже по этим паттернам предсказывать относительную популярность треков.

     28.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Разработка на Python: когда много думать = вредить проекту

Молодые разработчики, а иногда и опытные, стремясь сделать код «идеальным», часто уходят в оверинжиниринг и создают трудночитаемые конструкции. В итоге на реализацию уходит больше времени, а поддержка превращается в хард-квест с поиском ответов.    Если и у вас есть желание написать какую-нибудь сложную абстракцию «на будущее» или применить новый паттерн просто потому, что вы его выучили — остановитесь на секунду.

     28.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Как мы укротили сложный процесс с помощью CQRS и стейт-машин

Сегодня я хочу рассказать, как мы наводили порядок в коде одного из наших микросервисов, почему отказались от лапши в контроллерах, и главное — почему мы решили выложить наш внутренний архитектурный фреймворк в Open Source. Если вы пишете на Python и хоть раз сталкивались с болью распределенных транзакций, отваливающихся внешних API и проблемой dual-write (двойной записи) — присаживайтесь поудобнее. Речь пойдет про наш open-source фреймворк python-cqrs (он же доступен на PyPI).

     28.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Байты, нибблы, и подсветка: пишем свой TUI hex-редактор на Python

В жизни каждого разработчика иногда приходится рассматривать бинарные файлы через специальные HEX-редакторы.Мы открываем его, видим три колонки цифр и букв, и кажется что все предельно ясно-понятно. Но почему адреса считаются шестнадцатеричными, что такое ниббл и зачем он вообще нужен? В этой статье мы не просто напишем свой hex-редактор на Python — мы разберем, как он устроен, от битового представления до цветовой подсветки. 

     27.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

predict_proba выдаёт 0.9 — но это не вероятность 90%

В ML легко перепутать аккуратное число с честной вероятностью: модель выдаёт predict_proba = 0.9, и кажется, что событие произойдёт в 90% случаев. Но это не всегда так. В статье разбираем, почему выход модели может быть просто внутренней оценкой уверенности, чем калибровка отличается от AUC, как увидеть смещение через reliability diagram и Brier score — и когда вероятности нужно обязательно калибровать, прежде чем использовать их в бизнес‑решениях.

     27.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Ускоряем и оптимизируем numpy, pandas, scipy и sklearn

За это время в библиотеки были добавлены поддержка CUDA, множество ручных SIMD-оптимизаций с динамическим выбором SIMD, несколько реализаций линейной регрессии и многое другое. Давайте рассмотрим, что на сегодняшний день позволяет сделать моя библиотека.

     27.05.2026       Выпуск 650 (25.05.2026 - 31.05.2026)       Статьи

Как мы анализировали поведение пользователей Яндекс Музыки на 50 млн событий

Музыкальные стриминговые сервисы давно перестали быть просто каталогами треков. Сегодня значительная часть пользовательского опыта формируется рекомендательными системами: персональными подборками, автоматическими плейлистами, «волнами» и похожими механизмами. Пользователь может сам искать музыку, добавлять треки в библиотеку и слушать знакомых артистов, а может переходить по рекомендациям алгоритма. Возникает естественный исследовательский вопрос: рекомендации действительно расширяют музыкальный кругозор или, наоборот, закрепляют уже существующие предпочтения пользователя?