14.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Анализ данных с сайта Pet911

По данным Информационного телеграфного агентства России (ТАСС), в 2024 году в России было потеряно и найдено более 168 тысяч домашних животных, что на 17% больше, чем годом ранее. Для повышения шансов найти питомца живым и невредимым, помимо самостоятельных поисков, можно обратиться к волонтёрским сообществам и специализированным сервисам – именно волонтеры помогают найти более 90% пропавших животных. Одним из ключевых онлайн‑ресурсов, аккумулирующих информацию о пропаже и находке животных, является Pet911.

11.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Django 6.0: эволюция фреймворка в деталях

В свежем релизе фреймворк усиливает совместимость между СУБД, упрощает работу с email, улучшает ORM, добавляет удобства в шаблонах и снижает риск «выгорания» первичных ключей.

11.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Как я тв-шоу переводил с помощью ML-моделей без подписок и СМС

Сейчас мы переживаем бум ИИ-сервисов, которые за небольшую плату могут реализовать любые ваши творческие фантазии без необходимости глубокого понимания технических принципов их работы. Но я из тех, кто любит «ковыряться под капотом», поэтому в качестве проекта «выходного дня» я решил реализовать сервис машинного закадрового перевода видео с помощью общедоступных моделей с локальным запуском. А что из этого вышло – читайте далее.

11.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Руководство по PyTorch для новичков: создаём модель множественной регрессии с нуля

После взрывного роста интереса к ИИ я всё чаще вижу, что PyTorch заметно опережает TensorFlow по популярности. Оба фреймворка очень мощные и позволяют дата-сайентистам решать самые разные задачи, включая обработку естественного языка, что вновь подогрело интерес к глубокому обучению.

11.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Как квантовать LLM. Практическое руководство для начинающих

Рост числа параметров в LLM и других нейронных сетях создает проблему того, что запускать их может все меньшее количество людей. Это связано с тем, что запуск больших моделей требует наличие мощного оборудования, недоступное всем.

Для решения этой проблемы разрабатываются различные виды оптимизации, позволяющие запускать крупные нейронные сети (в частности LLM) на менее мощном оборудовании. Одним из наиболее популярных подходов оптимизации LLM является квантизация.

10.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Python + Fortran: Когда numpy уже мало, а C++ ещё страшно. Ускоряем код в 150 раз

В прошлой статье я рассуждал о том, почему Fortran в 2025 году всё ещё жив и даже растет в рейтингах. В комментариях справедливо заметили: «Философия — это хорошо, но как это применить современному разработчику? Зачем мне Fortran, если я пишу на Python?».

10.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Multi-API Ensemble: 95% точности транскрипции региональных топонимов

В статье полный разбор архитектуры, алгоритмы scoring, примеры кода и расчёт экономики.Один STT-сервис дал 60-70% точности на специфической лексике (топонимы, названия улиц, профессиональные термины). Два сервиса параллельно + взвешенное голосование + AI-fusion для спорных случаев дали 95%+ точности. Время обработки 5-8 секунд.

10.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

От «обезьяньей» работы к Smart-анализу: как правильно готовить данные для моделей.Что такое Exploratory Data Analysis и как избежать основных ошибок при его выполнении.

09.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Generalized Propensity Score: как оценить эффект от непрерывного воздействия без A/B-теста

В прошлом квартале мы задались вопросом: как оценить эффект от времени, которое пользователь проводит в нашем разделе, на Retention Rate (RR)? Казалось бы, решение очевидное: провести A/B-тест, но на поверку всё оказалось не так просто. В статье разберем, как у нас получилось определить эффект, с какими сложностями столкнулись в процессе и как нам помог метод Generalized Propensity Score.

08.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Как я с DeepSeek писал информационную систему (электронный журнал) для образовательного центра за пару дней

В прошлых материалах я упоминал, что работаю преподавателем в центре для одарённых школьников.
Центров этих в районе десятка по стране. И до этого года все они работали на базе общей информационной системы.

08.12.2025 Выпуск 626 (08.12.2025 - 14.12.2025) Статьи

Реализуем компьютерное зрение на практике

На тему компьютерного зрения есть множество различных публикаций, которые в основном рассказывают о применении этой технологии в разных отраслях. Однако, зачастую публикации содержат лишь общую информацию о том, что реализовано и для каких задач, но при этом отсутствует описание того, как это можно сделать.

07.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

Реальный кейс настройки Pod Autoscaling в k8s с точки зрения разработчика

На носу 2026 год, а я хочу поделиться своим путешествием по переводу приложения на инфраструктуру Kubernetes. Самой сложной и интересной частью была настройка автоскейлинга. Не слишком ли заезженная тема? Думаю нет, потому что я буду рассказывать именно с позиции разработчика приложения, а не девопса. Мне повезло, я без понятия как это всё настраивается. Я буду рассказывать как это всё работает. Конфигов кубера будет минимум, рассуждений и погружений в метрики максимум. В конце оставил TL;DR. Поехали?

07.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

Сводка от pythonz 30.11.2025 — 07.12.2025

А теперь о том, что происходило в последнее время на других ресурсах.

07.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

Чего нам стоит перевод фильма AI построить

Большинство фильмов идут на английском или испанском языке. И тут пришла в голову мысль, "а чтобы нам не использовать ИИ для перевода фильмов", к тому же множество компаний уже предлагают подобные решения. Но мне было ещё интересно изучить этот вопрос и пройти весь путь самим.

05.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

Токенизация, как ключ к языковым моделям для низкоресурсных языков

Хочу поделиться своими наблюдениями о том, как статистические алгоритмы извлекают грамматику из текстов.

05.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

marimo — реактивный аналог Jupyter Notebook

Рассматривается фреймворк marimo, названной в честь аквариумной водоросли, изображенной на заставке к статье. marimo позволяет работать с блокнотами — текстовыми файлами Python, ячейки блокнотов представляют собой декорированные функции Python.

04.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

Мониторинг SSSD через D-Bus: создаем собственный Ansible-модуль вместо sssctl

Сегодня хочу поделиться опытом того, как я отказался от стандартной утилиты мониторинга SSSD в пользу прямого общения с демоном через D-Bus и создал полнофункциональный Ansible-модуль.

04.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A/B-тестирования

Наша модель основана на классической архитектуре Bidirectional Encoder Representations from Transformers (BERT), улучшенной под задачи и проблемы, с которыми сталкивается маркетплейс.

04.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

Контроль качества переводов на основе ИИ

А вы задумываетесь иногда, что вот хочется что-то сделать такое, чтобы как-то выбиться из общей массы разработчиков? Сейчас придумаю идею, реализую, стану зарабатывать много денег? Все же так думают? Или только я один.Да вот поэтому я и делаю постоянно какие-то проекты. И да, все они простые и не выдающиеся, но, наверное, главное — не унывать. Утешаю я себя так.

04.12.2025 Выпуск 625 (01.12.2025 - 07.12.2025) Статьи

Дифференциальная приватность в ML

Сегодня поговорим в коротком формате о защите данных при обучении моделей, а именно в процессе обучения. Никому не понравится, если ваша нейросеть вдруг выдаст чужие паспортные данные или медицинские записи, правда? А ведь модели машинного обучения иногда склонны запоминать кусочки обучающего набора.

Все Только на русском Только на английском

IT-новости про Python, которые стоит знать