IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     08.08.2022       Выпуск 451 (08.08.2022 - 14.08.2022)       Статьи

Восстановление (импутация) данных с помощью Python

На данный момент Python является самым популярным языком программирования, который применяется для анализа данных или в машинном обучении. Сильными сторонами Python являются его модульность и возможность интегрироваться с другими языками программирования.

В науке о данных разведочный анализ данных (exploratory data analysis, EDA) является самым важным этапом в проекте и занимает около 70-80% времени всего проекта. Такой анализ позволяет изучить какие-то свойства данных, найти в них закономерности, аномалии, очистить их, подготовить и построить начальные модели для дальнейшей работы. На этом этапе можно определить вид распределения, оценить основные его параметры, обнаружить выбросы, построить матрицу корреляции признаков и т.д.

     08.08.2022       Выпуск 451 (08.08.2022 - 14.08.2022)       Конференции, события, встречи разработчиков

PyCon Russia 2022: два дня докладов, песни под гитару и костер в центре Москвы

Товарищи! PyCon Russia 2022, о необходимости которого все время говорили большевики питонисты, совершился! 30 и 31 июля в Москве состоялась самая долгожданная, уютная и душевная конференция для python-разработчиков и специалистов data science и ml. Мы выдохнули и спешим рассказать, как это было. 

     08.08.2022       Выпуск 451 (08.08.2022 - 14.08.2022)       Статьи

Устаревшие Python-библиотеки, с которыми пора попрощаться

В Python, с каждым релизом, добавляют новые модули, появляются новые и улучшенные способы решения различных задач. Все мы привыкли пользоваться старыми добрыми Python-библиотеками, привыкли к определённым способам работы. Но пришло время обновиться, время воспользоваться новыми и улучшенными модулями и их возможностями.

     08.08.2022       Выпуск 451 (08.08.2022 - 14.08.2022)       Статьи

“Да кто это написал?!!”, или решение сложных задач простыми средствами

Каждый день тысячи программистов трудятся не покладая рук. Они пишут код, контактируют между собой и, как и любой человек, совершают ошибки. Проблемы в коде могут повысить уровень рисков и стать критическими для компании. И с целью выявления таких ошибок специалисты проводят анализ кода.

     07.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Обработка изображений с помощью библиотеки Python Pillow

Данный туториал является переводом статьи, написанной Stephen Grupetta. Все изображения и коды скопированы без изменений. В конце вы найдете примечания относительно данной информации, а также ссылку на github с работающим кодом. Если код, приведенный автором не запускается, переходите в примечания и, возможно, сможете найти решение вашей ошибки.

     07.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи
     07.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Поиск открытого API сайта или Ускоряем парсинг в 10 раз

Цель статьи — описать алгоритм действий поиска открытого API сайта.
Целевая аудитория статьи — программисты, которым интересен парсинг и анализ уязвимостей сайтов.
В статье рассмотрим пример поиска API сайта edadeal.ru, познакомимся с протоколом google protobuf и сравним скорость различных подходов парсинга

     06.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Распознавание поднятых пальцев на Python+OpenCV

В данной статье хочу рассмотреть банальный и не сложный проект, а именно подсчет количества поднятых пальцев.Все исходники можно найти на моем Github.Код будем рассматривать с самого начала, но лучше всего ознакомиться с моими предыдущими статьями.

     05.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Программирование на Python и установка Docker для Sipeed Lichee RV RISC-V

В первой части познакомились с процессором Allwinner D1 на RISC-V архитектуре, рассмотрели возможности, поработали с одноплатным компьютером Sipeed Lichee RV. Старый образ операционной системы содержал многие недоработки, которые не позволяли полностью оценить работу одноплатника. В продолжение рассмотрения Lichee RV, возьмем новый образ Ubuntu, построенный на последнем ядре Linux 5.19, окончательный выпуск которого ожидается в конце июля 2022 года. Поработаем с GPIO из Python`а и установим Docker. Теперь полноценно протестируем новый образ, проверим на что способна плата и начнем уже программировать на Python.

     03.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Как стажёр оптимизировал запросы и нашел баг в Django

Недавно я нашел баг в Django, создал тикет с исправлением и его приняли.В статье расскажу подробнее — над чем работал, в чем была ошибка и почему ее сложно встретить. А также еще про один баг, который по классике оказался фичей 😊.

     03.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Feature Engineering или стероиды для ML моделей

Часто при построении ML моделей мало просто взять сильную модель. Оказывается, иногда грамотная предобработка данных существенно важнее. Сегодня речь пойдёт про feature engineering. Рассмотрим несколько кейсов на эту тему более подробно. Данные будут упрощённые, но обещаю, от этого примеры не станут менее интересными 😉.

     02.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Бутстреп и А/Б тестирование

В этой статье разберёмся, как с помощью бутстрепа оценивать стандартное отклонение, строить доверительные интервалы и проверять гипотезы. Узнаем, когда бутстреп незаменим, и в чём его недостатки. 

     02.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Сам себе data scientist или зачем нужен анализ данных менеджеру по продажам

Когда начинал работать менеджером по продажам, меня постоянно мучали вопросы: почему клиент отказался, где моя зона роста, что делать, чтобы продавать больше? И тогда я решил все взять в свои руки. В статье я расскажу о своём опыте создания DYI-системы учета и прогноза продаж в Excel (или его аналоге Cacl из пакета LibreOffice), Power BI и Python 3 с подключенной библиотеками Pandas, NunPy и MatPlotLib.

     01.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи
     01.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Использование SymPy в вычислениях

Добрый день уважаемые пользователи. Данная статья ориентированна на начинающих программистов. Как вы знаете для Python существует большое множество библиотек которые помогают с вычислениями. И я хотел бы поделиться одной из библиотек, которая может существенно помочь при вычислениях, но использовать ее в коде я не рекомендую. Но она может значительно облегчить вам жизнь, если вы решаете уровнения и занимаетесь их преобразованием, упрощением для дальнейшего использования.Библиотека SymPy умеет многое, начиная с решения уравнений и заканчивая построениями графиков, но тут я хотел рассмотреть на примерах, как же работают функции "упрощения" в этой библиотеке на примере решения нескольких простых задач. Приступим!)

     01.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Переход от Платформы работы с данными к Платформе конфиденциальных вычислений

Одна из моих целей — это развитие платформы конфиденциальных вычислений. Именно о них мы и будем говорить в данной статье, пройдя путь по преобразованию Платформы работы с данными в Платформу конфиденциальных вычислений над данными, где основной целью является – обеспечить нераскрытие информации, загружаемой в Платформу, даже для администратора

     01.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Drag-and-Drop на Python+OpenCV

В данной статье расскажу про простой Drag-and-Drop на Python+OpenCV.Идея заключается в перемещении созданных квадратов на экране жестами руки. Так как нам потребуется как-то воспроизводить клик, то представим, что кликом будет служить соединение указательного и среднего пальцев. Теперь можно писать код.

     01.08.2022       Выпуск 450 (01.08.2022 - 07.08.2022)       Статьи

Мой путь во Flask. Часть первая

Путь джуна во Flask. Бортовой журнал

     29.07.2022       Выпуск 449 (25.07.2022 - 31.07.2022)       Статьи

История о том, как Python помог купить мебель в ИКЕА

В связи с уходом ИКЕА с российского рынка 5-го июля 2022 года в магазине стартовала онлайн-распродажа. Желающих купить стильные и недорогие вещи для дома оказалось настолько много, что сайт компании в первый день распродажи перестал работать, из-за чего её перенесли на пару дней. Сотрудники компании нашли выход из сложившийся ситуации - создали электронную очередь.

Это помогло снизить нагрузку на сервера, но стрессовое бремя на пользователей сайта возросло. Потенциальным покупателям приходилось часами/днями ждать своей очереди, обновлять страницу и не отходить от компьютера. Некоторые мои знакомые потеряли 3 дня отпуска на «сизифов труд», но справедливости ради они успели сделать 4 заказа. Чтобы не тратить столько времени на сайте компании, я решил реализовать следующую идею:

     29.07.2022       Выпуск 449 (25.07.2022 - 31.07.2022)       Статьи

Часть 3. Распознаем время на видеозаписях матчей Dota 2 с помощью трансформеров

В данном цикле статей мы реализовываем систему автоматического поиска хайлайтов в матчах Dota 2. Для ее создания нам требуется размеченный датасет с тайм-кодами. На YouTube есть множество каналов, где люди выкладывают нарезки с интересными моментами из профессиональных матчей по Dota 2. Зачастую на видео есть маленькие часы из интерфейса игры. Время на них мы и будем распознавать.