IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter


Новый материал в ленте
  virtualenv - 20.29.1

Инструмент создания виртуального рабочего окружения. Скачать можно по ссылке: https://pypi.python.org/pypi/virtualenv


Python Дайджест. Выпуск 576

(23.12.2024 - 29.12.2024)

поделиться выпуском 
Дайджест python,

Статьи

  Пишем свой PyTorch на NumPy. ФИНАЛ. Запускаем GPT-2

В этой части мы будем писать инференс код для GPT2 на собственной библиотеке!

  Remote Config и A/B-эксперименты: история разработки и основные возможности

Сегодня расскажу про наш сервис Remote Config и A/B-эксперименты — это переработка одного из моих докладов

  Как реализовать рекомендательную систему аудиокниг с использованием больших языковых моделей (LLM)

Сегодня я расскажу о том, как мы реализовали систему подбора аудиокниг и зачем это вообще было сделано. В статье мы фокусируемся на принципе рекомендации похожих книг (а подходы для авторов в нашем случае были сделаны аналогично).

  Сводка pythonz 22.12.2024 — 29.12.2024

А теперь о том, что происходило в последнее время на других ресурсах.

  Мэтчинг персонажей. Level Hard

Для всех, кто знаком со свертками, задача мэтчинга персонажейне кажется сверхсложной. На Kaggle есть даже соревнования с подобной задачей и размеченный датасет с персонажами мультсериала Симпсоны.

  Пишем свой PyTorch на NumPy. Часть 3. Строим граф вычислений

В этой статье мы продолжим реализацию собственный библиотеки машинного обучения на NumPy!

  Polars vs Pandas: битва титанов. Кто кого?

Сегодня будем сравнивать две библиотеки — Polars и Pandas. Обсудим, какие преимущества есть у Polars и за счет чего она выигрывает в производительности.

  Стратификация: как не облажаться с A/B тестами

Представьте: вы запускаете A/B тест. Цель проста: проверить, работает ли новая кнопка лучше старой. Но тут же возникает мысль: «А вдруг мобильные юзеры и десктопные реагируют по-разному? А что с новыми пользователями? Их мнение ведь явно не равноценное опытным юзерам». Без стратификации результат может быть так себе.

  Пишем свой PyTorch на NumPy. Часть 1

PyTorch — это мощный и гибкий фреймворк для машинного обучения, широко используемый для создания нейронных сетей. Он особенно популярен благодаря простоте использования, динамическим вычислительным графам и богатой экосистеме инструментов для обучения моделей. В этой статье мы реализуем собственную библиотеку машинного обучения на NumPy!

  SVG-виджеты для tcl/tk. Финальный аккорд. Часть IV

Реализация проекта «SVG-виджеты для tckl/tk» позволяет устранить одну из главных претензий, предъявляемых к графическому интерфейсу приложений, разрабатываемых с использованием tk - устаревший дизайн виджетов.

  Topological Sort

A Directed Acyclic Graph (DAG) is a common data structure used to contain a series of related items that must have certain order or dependency. Topological sorting is used to help find where you might start processing to get in order handling of the items in a DAG.

  This Django Template Tag is Killing Your Performance

Avoid performance pitfalls by replacing the length template filter with count() for QuerySet objects to prevent excessive memory and database usage.

  Пишем свой PyTorch на NumPy. Часть 2. Добавляем новые слои

PyTorch — это мощный и гибкий фреймворк для машинного обучения, широко используемый для создания нейронных сетей. Он особенно популярен благодаря простоте использования, динамическим вычислительным графам и богатой экосистеме инструментов для обучения моделей. В этой статье мы продолжим реализовывать собственную библиотеку машинного обучения на NumPy!

  Базовая настройка SAST и DAST для django в gitlab cicd: как быстро внедрить решения по безопасности

Сегодня расскажу вам о базовой настройке SAST и DAST для django в gitlab cicd. В разработке использование SAST (Static Application Security Testing) и DAST (Dynamic Application Security Testing) в последние годы стало уже стандартом.

  Telegram-бот-магазин на Python: пошаговый гайд с оплатой, каталогом и админкой (Aiogram 3 + SQLAlchemy 2)

На этот раз мы создадим полноценного Telegram-бота для продажи цифровых товаров с базой данных, которой будем управлять через SQLAlchemy 2, админ-панелью, пользовательской частью и интегрированной оплатой через Юкассу.

  SOAP, XML и Python: получаем данные с zakupki.gov.ru

Эта статья написана для начинающих пользователей, которые хотят разобраться в работе сервиса отдачи информации zakupki.gov.ru. Мы шаг за шагом разберем, как получить токен для физического лица, как выглядит XML-документ для запроса и как написать простую программу на Python для взаимодействия с сервисом.

  Какие зарубежные компании подают патентные заявки в РФ в 2023, 2024 годах

Я патентный поверенный, мне интересно работать с данными, у Роспатента появилась открытая и удобная для обработки статистика по зарубежным заявителям, и мне стало интересно поизучать ее.Коротко о процессе: скачал два файла с данными (за 2023 год и за 2024 год (с учетом даты выхода статьи это почти полные данные за 2024 год)), с помощью небольшого скрипта на питоне построил следующие графики:

  Царство грибов. Симуляция мицелия на p5py. Битвы гифов. Часть первая

Одни из самых долгоживущих, самых скрытных и самых древних организмов на Земле. Грибы. Существа в скрытом царстве под горой. Они меня всегда увлекали.В 1998 году внимание биологов привлекла гибель деревьев, чьи корни были опутаны грибницей.

Видео

  Анализируем исходный код с пользой

Расскажу, как обеспечить соблюдение командных конвенций и порядок в хранилище тестовых артефактов с помощью синтаксического анализа. Также поделюсь опытом написания и внедрения собственного линтера для проекта с пятьюстами тестовыми сценариями, который значительно упростил работу ревьюеров и улучшил читабельность отчетности.

  Самописный PyCharm плагин

Подход к ведению словаря терминов используемых в коде Python-проекта. Как он может помочь в уменьшении когнитивной нагрузки при чтении кода и помочь новому разработчику быстрее погрузиться в контекст проекта.

  Ускорение обработки данных

Расскажу про успешный опыт ускорения многопоточного приложения написанного на pandas. Покажу сравнение синтаксиса и производительности polars с другими решениями. Дам полезные советы по миграции

Интересные проекты, инструменты, библиотеки

  RealOrangeOne/django-tasks

A reference implementation and backport of background workers and tasks in Django.

  django-liveconfigs - управление настройками в django

Как добавить кучу настроек для администратора в свой проект на django без дополнительных сервисов feature-toggle и потом в них не потеряться.

  opik

From RAG chatbots to code assistants to complex agentic pipelines and beyond, build LLM systems that run better, faster, and cheaper with tracing, evaluations, and dashboards.

Релизы

  pylint - 3.3.3

Статический анализатор Python-кода. Скачать можно по ссылке: https://pypi.python.org/pypi/pylint/

  coverage - 7.6.10

Утилита позволяющая измерить процент покрытия тестами. Скачать можно по ссылке: https://pypi.python.org/pypi/coverage/