IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     08.07.2025       Выпуск 604 (07.07.2025 - 13.07.2025)       Статьи

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей

Что такое дообучение LLM и зачем оно нужно?Дообучение больших языковых моделей (LLM) — это способ адаптировать их под свои задачи, сделать их умнее на своих данных и сэкономить ресурсы.Когда стоит дообучать, а когда хватит prompt engineering или RAG? Если задача уникальная или данных много — дообучай. Если задача простая — попробуй сначала промпты.

     08.07.2025       Выпуск 604 (07.07.2025 - 13.07.2025)       Статьи

Скрипт, который следит за тобой: автоматический аудит действий в Linux

В статье хочу разобрать auditd - полезный инструмент аудита в Linux, который записывает каждое действие, а скрипт превратит логи в читаемые отчёты и алерты.

     08.07.2025       Выпуск 604 (07.07.2025 - 13.07.2025)       Статьи

Про книгу Стефани Стимак «Дизайн для разработчиков»

Захотелось мне обновить свои знания по фронтенд-разработке, которые у меня застряли на уровне CSS времен Internet Explorer 6 9, а также принципов веб-дизайна примерно тех же годов. Начать решил с книги Стефани Стимак «Дизайн для разработчиков». Судя по названию, это должна была быть именно та книга, которая мне нужна.

     07.07.2025       Выпуск 604 (07.07.2025 - 13.07.2025)       Статьи

Как производили подсчет объема древесины с помощью Computer Vision

Отвечу почему мужик с линейкой не подойдет и почему нельзя просто взвесить Камаз до и после погрузки.

     06.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Оживляем данные Strava: от парсинга GPX до интерактивной карты на Python и JS

В этой статье я хочу провести вас «под капот» моего проекта и показать на реальных фрагментах кода, как с помощью Python, щепотки NumPy и капли JavaScript можно построить собственный мощный инструмент для анализа спортивных данных. Это история не только про код, но и про философию открытых данных и желание сделать профессиональные инструменты доступными для всех.

     04.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Видео

100 Million Parking Transactions Per Year with Django

For several Dutch municipalities, Django applications power the monitoring of both on-street and off-street parking transactions. What started as a straightforward tool for extracting data from parking facilities has evolved into a robust ETL platform with a feature-rich dashboard. This talk delves into how Django remains the backbone of our operations and why it continues to be the foundation of our business success.

     04.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Создаем датасет печатных букв с любым шрифтом за 170 строк

В этой работе разбирается простой способ генерации изображений букв для подготовки данных для обучения нейронной сети для классификации (распознавания) букв русского алфавита.

     04.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Wiki-хак для SEO: находим брошенные домены и передаём их силу вашему сайту

Расскажу, как работает метод перелива веса с Wikipedia через редирект. Разберу готовый Python-скрипт для автоматического поиска таких доменов. Дам рекомендации по дальнейшей работе с найденными доменами.

     07.07.2025       Выпуск 604 (07.07.2025 - 13.07.2025)       Статьи

Милливольтметр на экране ПК: простое решение

Данная заметка посвящена решению несложной задачи: измерить и вывести на экран ПК пару значений постоянного напряжения. В качестве измерителя используется готовое изделие: плата 16-канального 12-разрядного АЦП с USB интерфейсом на базе микроконтроллера STM32.

     06.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Сводка от pythonz 29.06.2025 — 06.07.2025

А теперь о том, что происходило в последнее время на других ресурсах.

     03.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Винтик и Шпунтик, часть 3: лемма Бернсайда и генерация орбит

Это третья часть моих наработок по решению задачи Винтика и Шпунтика. В прошлой части мы хорошо так свернули формулу включений-исключений для ускорения вычисления ответа. В этой части мы дополнительно ускорим вычисление формулы, разбив слагаемые формулы на классы эквивалентности, где в каждом классе слагаемые одинаковые и их надо будет вычислять только один раз. В этом нам поможет комбинаторная теория групп и её применение в задачах о раскрасках. По большей части эта статья содержит общую теорию решения подобных задач, так что эта информация может быть полезна и вне контекста задачи про Винтика и Шпунтика.

     03.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Как понять что свинюшка готова к любви? Определяем через ML

Сегодня я расскажу, как мы анализировали поведение свинок с помощью ML, чтобы выявить идеальный момент для их оплодотворения.

     03.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Работа с данными в DuckDB или не pandas’ом единым сыт DS

В проектах по разработке ML-моделей я регулярно сталкиваюсь с тем, что значительная часть времени уходит не на саму модель, а на приведение данных в нужный формат: очистку, трансформацию, агрегацию.Этот этап требует не только времени, но и вычислительных ресурсов, особенно когда речь идет о больших объемах информации. В этой статье я расскажу о своем небольшом исследовании DuckDB — инструменте, который может значительно упростить и ускорить работу с данными.

     03.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Процедурная генерация воксельных рогаликовых уровней

Процедурная генерация воксельных рогаликовых уровней с использованием клеточных автоматов и алгоритмов работы с сеткой ячеек на Python. Описана начальная генерация уровней, их упорядочивание, прокладка путей.

     03.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Сравнение форматов PNG: от первой до третьей редакции

Недавно опубликованная третья редакция спецификации Portable Network Graphics (PNG) 2025 года, разработанная World Wide Web Consortium (W3C), привлекла внимание к эволюции этого формата (W3C PNG Specification (Third Edition, 2025)). Ранее я, как и многие, использовал PNG, не задумываясь о его развитии и различных редакциях. Углубившись в изучение спецификаций PNG (1996, 2003, 2025), я решил подготовить данную статью, чтобы обобщить ключевые изменения и их значение для веб-дизайна, разработки игр и мультимедиа.

     03.07.2025       Выпуск 603 (30.06.2025 - 06.07.2025)       Статьи

Статус: в неточном поиске (fuzzy match)

Задача нахождения неточных дубликатов текстовых строк - удивительно часто встречается на практике.Нахождение неточных дубликатов позволяет лучше понять структуру списка, повысить его качество (удаление дубликатов), провести техническую кластеризацию (выделить группы похожих). Всё это видно на графе выше.Но приключения начинаются, когда список становится размером несколько миллионов строк.