IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог


Новый материал в ленте
  virtualenv - 20.30.0

Инструмент создания виртуального рабочего окружения. Скачать можно по ссылке: https://pypi.python.org/pypi/virtualenv


Python Дайджест. Выпуск 586

(03.03.2025 - 09.03.2025)

поделиться выпуском 
Дайджест python,

Статьи

  Исследование набора данных для обучения LVLM — SeeClick (Web Data)

В данной статье будет рассмотрен набор данных для обучения LVLM (Large Visual Language Model), который использовался авторами статьи "SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents" при обучении модели SeeClick, которая показывает достаточно неплохие результаты, по сравнению с аналогичными решениями.

  api2app: Как из домашнего компьютера сделать сервер для публичного приложения

Ранее я уже рассказывал, что при разработке api2app вдохновлялся идеей Python-библиотеки Gradio. У этой библиотеки есть очень полезный функционал: можно запустить приложение на локальном компьютере в режиме share (поделиться), тогда будет сгенерирована публичная ссылка, по которой это приложение будет доступно на любом другом компьютере, подключенном Интернет. В этой статье пошагово опишу свой способ.

  Digital Twin — цифровая копия физической системы

Цифровой двойник (Digital Twin, DT) представляет собой виртуальную копию физической системы, которая обновляется в реальном времени на основе данных, поступающих с реального объекта. Это динамическая модель, объединяющая физико-математические модели системы с методами анализа данных.

  Парсер для подростков с помощью pyparsing

Если ты подросток и начинаешь свой путь в программировании, или просто хочешь понять, как программы анализируют текст и превращают его в структуру, эта статья для тебя. Сегодня поговорим о том, что такое парсер, зачем он нужен и как с помощью библиотеки pyparsing создать свой собственный парсер — основу для мини‑языка. Разберём, как создать парсер для арифметических выражений, добавить поддержку скобок, встроить вычисление выражений, работать с переменными и обрабатывать ошибки.

  Детективная история с дебагом проблем C-уровня в Python

Не так давно я занимался проектом по распилу монолитной системы автомодерации. Моей задачей было выделить из нее крупный блок логики, связанный с поиском дубликатов объявлений. Требовалось переосмыслить порядка 60 000 строк кода на Python, разработать новую архитектуру и аккуратно смигрировать систему.

  Low Overhead Allocation Sampling With VMProf in PyPy’s GC

This is a very deep dive on a high performance statistical profiler tightly integrated with PyPy.

  Виртуальная доска, которая не даст о себе позабыть. Повышаем эффективность работы, учебы и саморазвития

Разберем, чем может быть полезна маркерная доска для личного пользования, саморазвития, изучения иностранных языков и пр.;

Реализуем виртуальную доску, которая будет "мозолить" нам глаза и не даст забыть о важном;

Разберем некоторые технические подробности реализации, а заодно уличим хваленые ведущие LLM в обмане;

 

  Определение пользовательских сценариев энергопотребления по встроенным в системную плату датчикам и Python + LightAutoML

С момента предыдущей публикации прошел год, и наступил момент закрыть гештальт, возникший, в том числе, по результатам ваших комментариев. А именно: можно ли вообще обойтись без внешних устройств при решении задачи профилирования активности пользователей по данным энергопотребления их устройств?

  Как я сделал RAG для своей компании

Появилась свободное время, и я решил сделать RAG (Retrieval Augmented Generation) для нашей компании. Компания небольшая, но документации технической и бизнес накопилось очень много, в основном на wiki. Цель - подключить бота в slack, который быстро может выдать инфу по нужной теме.

  Два пути к автоматизации: как создавать отчеты в Word массово

В статье рассматриваются два способа массовой генерации однотипных документов: с помощью функции «слияния» в Word и скрипта на Python.

  Сериализация в Python с Pickle

Сегодня мы рассмотрим одну из самых известных, но одновременно спорных технологий Python — библиотеку pickle. Если вы когда‑нибудь задумывались, как сохранять объекты в виде байтового потока и затем восстанавливать их, то эта статья для вас.

  Бизнес-сериал: формируем BI-систему в строительстве почти в прямом эфире. Часть III

Продолжаем серию статей о создании BI-системы в компании Sminex. Сегодня поговорим об автоматизации и оптимизации работы инженеров данных и BI-разработчиков. Работа с данными всегда требует поиска баланса между удобством, скоростью и качеством. В этой статье мы сосредоточимся на удобстве.

  Цифровизация чувств: упаковываем эмоции в датафрейм или базу данных

Эмоций, чувств и их оттенков много, они разные, и чтобы во всём этом разобраться, соберем их... в базу данных или датафрейм. Заодно установим связи между эмоциями, а также попробуем применить разные коэффициенты... Имея такую базу данных, мы сможем научить LLM распознавать эмоции и их оттенки, лучше понимать человека. В этой статье описываются практические моменты создания такого "датафрейма эмоций".

  Книга: «Excel с Python и R: раскройте потенциал расширенной обработки и визуализации данных»

Если вы работаете с данными, то наверняка сталкивались с ситуацией, когда Excel становится вашим лучшим другом и злейшим врагом одновременно. С одной стороны, это удобный и привычный инструмент для работы с таблицами, с другой — его ограничения могут превратить даже простую задачу в настоящий кошмар. Но что, если бы вы могли объединить мощь Excel с гибкостью и возможностями Python и R?

  Цифровая карта аварийности: как технологии помогают сделать дороги безопаснее

Буквально недавно в ИЦ прошло ежегодное мероприятие “Инновационная столица-2024”, где мой коллега, руководитель отдела цифровых сервисов, продемонстрировал обновленный АИС “Мониторинг аварийности”. Цифровая карта ДТП не имеет аналогов в России, поэтому в этой статье я бы хотел рассказать, чем так уникален продукт, и как он помогает снижать количество ДТП в городе. 

  Сводка от pythonz 02.03.2025 — 09.03.2025

А теперь о том, что происходило в последнее время на других ресурсах.

  To Type or Not to Type?

Don’t let the title fool you, Jonathan is pro type-hints. This post talks about all the benefits of adapting the optional practice.

  Self-healing тесты и локальная LLM

В этой статье расскажу о практическом применении больших языковых моделей (LLM) в сочетании с традиционными инструментами автоматизации Python/Selenium для повышения надежности тестов.

  Наш архитектурный подход к Python приложениям

Мы долгие годы писали сервисы исходя из каких-то своих внутренних ощущений правильности их написания. Но синхронизироваться по хорошим практикам в разных командах бывает довольно сложно и часто хорошие практики не выходили за рамки одной команды, а такого хотелось бы избежать. Поэтому мы решили объединить все хорошие по нашему мнению практики в единый справочник. Этот справочник получил название «Архитектурный гайд». Про него и поговорим в данной статье.

  Простейшая нейронная сеть на Python для начинающих

Я и подошел к желанию написать свою собственную нейросеть, думаю у многих возникает такое же желание). Сразу оговорюсь, код будет писаться на основе классов как и у предыдущего автора, но на языке Python, я немного в курсе того, что с библиотекой Tensorflow и матрицами код будет работать быстрее, но я ориентируюсь на простоту и понятность, поэтому мой выбор – классы.

Вопросы и обсуждения

  Python Bytes: #422 You need 4 spaces

Очередной выпуск англоязычного подкаста Python Bytes

Видео

  Новости мира Python за февраль 2025

Ведущие – Григорий Петров и Михаил Корнеев

Релизы

  Sphinx - 8.2.3

Python генератор документации. Скачать можно по ссылке: https://pypi.python.org/pypi/Sphinx/

  pylint - 3.3.5

Статический анализатор Python-кода. Скачать можно по ссылке: https://pypi.python.org/pypi/pylint/

  Django - 4.2.20

Мощный web-фреймворк. Скачать можно по ссылке: https://pypi.python.org/pypi/Django/

  Django - 5.0.13

Мощный web-фреймворк. Скачать можно по ссылке: https://pypi.python.org/pypi/Django/

  Django - 5.1.7

Мощный web-фреймворк. Скачать можно по ссылке: https://pypi.python.org/pypi/Django/

  IPython - 8.34.0

Интерактивная оболочка для языка программирования Python. Скачать можно по ссылке: https://pypi.python.org/pypi/IPython

  pgcli - 4.2.0

REPL для Postgres. Скачать можно по ссылке: https://pypi.python.org/pypi/pgcli/

  mock - 5.2.0

Python модуль для создания заглушек (mock-объект) при тестировании. Скачать можно по ссылке: https://pypi.python.org/pypi/mock/

  pymongo - 4.11.2

Python интерфейс для MongoDB. Скачать можно по ссылке: https://pypi.python.org/pypi/pymongo/

  Jinja2 - 3.1.6

Простой и быстрый шаблонизатор. Скачать можно по ссылке: https://pypi.python.org/pypi/Jinja2/

  virtualenv - 20.29.3

Инструмент создания виртуального рабочего окружения. Скачать можно по ссылке: https://pypi.python.org/pypi/virtualenv