IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Метод главных компонент (PCA). Принцип работы и реализация с нуля на Python

Метод главных компонент (Principal Component Analysis или же PCA) — алгоритм обучения без учителя, используемый для понижения размерности и выявления наиболее информативных признаков в данных. Его суть заключается в предположении о линейности отношений данных и их проекции на подпространство ортогональных векторов, в которых дисперсия будет максимальной.

     09.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Вопросы и обсуждения

Final Pre-live Features - Building SaaS with Python and Django #184

In this episode, we completed the final features needed to get the site open for others to sign up. This included some dynamic limiting of the number of people allowed to sign up. We also had to add the template styling for the login page.

     08.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

How to spend less time writing Django tests

Autogenerating Django integration tests using Kolo and trace inversion.

     09.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Релизы

pytest - 8.1.1

Простой мощный инструмент тестирования в Python. Скачать можно по ссылке: https://pypi.python.org/pypi/pytest/

     08.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи
     08.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Как за один pet-проект получить два диплома

Все же знают серию компьютерных футбольных симуляторов FIFA? Раньше я много играл в эту игру. Кто-то скажет, что это бесполезная трата времени, но я с этим не согласен. Эта игра вдохновила меня на разработку pet-проекта, который стал моим бакалаврским дипломом.Во время игры в FIFA пользователь видит небольшую карту с местоположением игроков и мяча на поле, данный элемент интерфейса является очень полезной фичей, без которой невозможно представить полноценный игровой процесс. Мне показалось, что данную карту было бы неплохо перенести в реальный мир, используя видеозапись матча и нейросеть. 

     09.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Релизы

django-filter - 24.1

Django-приложение для гибкой фильтрации объектов модели (querysets). Скачать можно по ссылке: https://pypi.python.org/pypi/django-filter/

     07.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Как расширить возможности стандартного Enum

А может всё-таки есть способ сделать такой Enum, используя стандартную библиотеку Python?! Под катом будем разбираться в существующих вариантах решения. 

     07.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Open Source в финансах. Проект Okama

В среде финтех проектов наблюдается интересный парадокс. С одной стороны, вряд ли можно найти область, куда приходит больше инвестиций. Поэтому именно в финтехе сосредоточены самые продвинутые технологии: блокчейн, искусственный интеллект, биг дата, ML и др. С другой стороны, именно в финансовой области наблюдается наименьшее количество хорошо развитых open-source проектов.

     07.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Как мы делали корпоративный чемпионат по Python

Большинство сотрудников Mediascope используют Python для решения повседневных задач: разрабатывают модели машинного обучения, пишут код для веб-сервисов, анализируют данные, автоматизируют рутинные процессы. В прошлом году мы провели корпоративный чемпионат, который помог повысить мотивацию к изучению Python и оживить внутреннее комьюнити. А ещё чемпионат получил продолжение: модель из ML-трека стала прототипом во внутреннем конвейере обработки данных. Расскажем, как это было.

     07.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Модель глубокого обучения, использующая данные ЭКГ для прогнозирования риска внезапной сердечной смерти

Внезапная сердечная смерть (ВСС) происходит, когда возникают проблемы с электрической активностью в сердце. Это распространенная причина смерти по всему миру, поэтому было бы полезно легко выявлять людей с высоким риском ВСС. Электрокардиограммы - это доступный и широко используемый способ измерения электрической активности сердца. Мы разработали вычислительный метод, который может использовать электрокардиограммы для определения, находится ли человек в повышенном риске ВСС. Наш метод может позволить врачам скрининг больших групп людей и выявление тех, кто находится в повышенном риске ВСС. Это может позволить регулярное наблюдение за этими людьми и, возможно, предотвращение ВСС у некоторых из них.

     05.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Deploying Django Apps in Kubernetes

As an open-source container orchestration platform that automates deployment, scaling, and load balancing, Kubernetes offers unparalleled resilience and flexibility in the management of your Django applications.

     05.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Сравнение различных схем квантования для LLM

Как запустить локально LLM 70B параметров на 1 видеокарте с 24gb? Нужно квантование! Квантование - это процесс уменьшения битности вычислений в нейронной сети, используемых для представления весов, смещений и активаций. Путем снижения точности мы можем значительно сократить требования к памяти и вычислительной сложности модели.

     05.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Мульти-тенант в Django

Мульти-тенант (multi-tenancy) — это подход, который позволяет одному экземпляру приложения обслуживать множество клиентов или арендаторов (тенатов). Каждый арендатор изолирован от других, имея возможность кастомизации под свои нужды, при этом основной кодовой базой и инфраструктурой делится между всеми.Когда применять эту замечательную концепцию?

     04.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Методы очистки данных в Pandas

Аалитики данных часто сталкиваются с грязными данными, которые могут существенно замедлить процесс анализа. Грязны данные – это пропущенные значения, дубликаты, неконсистентные данные. Пропущенные значения заставляют нас гадать, что же было замыслено нашим коллегой; дубликаты вводят в заблуждение, умножая одно и то же на количество их копий, а неконсистентные данные заставляют нас сомневаться в каждой цифре.Очищать грязные данные можно c Pandas. Рассмотрим основные методы.

     04.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Азы больших языковых моделей и трансформеров: декодер

В этом материале мы поговорим об устройстве компонента‑декодера в системах машинного обучения, построенных по архитектуре «трансформер», уделив особое внимание отличию декодера от энкодера.

     06.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Релизы

pyparsing - 3.1.2

Python модуль для синтаксического анализа. Скачать можно по ссылке: https://pypi.python.org/pypi/pyparsing/