IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     31.03.2022       Выпуск 432 (28.03.2022 - 03.04.2022)       Статьи

Чистый AutoML для “грязных” данных: как и зачем автоматизировать предобработку таблиц в машинном обучении

В данном посте хотелось бы затронуть такую очень известную и много где описанную тему как предобработка табличных данных в Data Science. Вы можете задать вопрос: “А зачем нам это нужно, ничего нового то тут не скажешь?”. Действительно, что может быть банальнее обработки табличных данных для моделей машинного обучения. Но мы постараемся собрать как можно больше информации в одном ультимативном, если так угодно, гайде, и подадим его через призму автоматического машинного обучения (AutoML). 

     30.03.2022       Выпуск 432 (28.03.2022 - 03.04.2022)       Статьи

Как работать с числами с плавающей точкой в Python

В материале вы найдёте примеры работы с функциями и классами, предназначенными специально для решения проблем чисел с плавающей точкой.

     30.03.2022       Выпуск 432 (28.03.2022 - 03.04.2022)       Статьи

Маркетинговая аналитика на Python. Пишем код для RFM-сегментации

RFM - классический инструмент маркетинга для сегментации вашей клиентской базы. Я использую ее для работы в В2В, В2G сегменте. В основе него - понятные управленцу ценности: LTV и Purchase Frequency. 

     30.03.2022       Выпуск 432 (28.03.2022 - 03.04.2022)       Статьи

О том, как мы писали асинхронного telegram-бота «ScipIO»

Scipio - это telegram-bot, который позволяет пользователям решать задачи по математике, логике, создавать свои собственные карточки, ставить запуск тренировки в определенное время - в общем, обучаться.

     29.03.2022       Выпуск 432 (28.03.2022 - 03.04.2022)       Статьи

Разбираем алгоритмы компьютерной графики. Часть 6 — Анимация «Плазма»

Разновидностей алгоритмов генерации "плазм" столько же, сколько, наверное, звезд на небе. Но связывает их вместе принцип плавного формирования перехода цветов.

Для бесшовного формирования цвета очень часто используются тригонометрические функции. Во-первых, потому что они периодические, т.е. через определенный промежуток значения функции повторяются, а во-вторых, они возвращают непрерывные значения, т.е. бесконечно малому приращению аргумента соответствует бесконечно малое приращение функции. Благодаря этому можно используя простые комбинации функций получать плавное возрастание и убывание цветов.

     29.03.2022       Выпуск 432 (28.03.2022 - 03.04.2022)       Статьи

Мой друг Netmiko. Часть 3: один скрипт для разных устройств Huawei

Мы уже разобрали в прошлых частях как накатить на сетевые устройства Huawei список команд из внешнего файла. И это работает, если у нас сеть состоит из одинаковых устройств. Конечно, в реальной практике такое встречается редко. В этой работе мы рассмотрим как использовать разные конфигурационные файлы для разных устройств Huawei, при этом не выходя за рамки одного скрипта. То есть у нас будет все тот же скрипт на основе Netmiko, но в зависимости от версии устройства, конфиг будет накатываться разный: один конфиг для коммутатора CloudEngine Huawei, другой конфиг для роутера AR3200 Huawei.

     28.03.2022       Выпуск 432 (28.03.2022 - 03.04.2022)       Статьи

Text Detection and OCR with Microsoft Cognitive Services

Table of Contents Text Detection and OCR with Microsoft Cognitive Services Microsoft Cognitive Services for OCR

     28.03.2022       Выпуск 432 (28.03.2022 - 03.04.2022)       Статьи

Путь к пониманию декораторов в Python

Прим. Wunder Fund: В этой статье разбираемся, что такое декораторы в Python, зачем они нужны, и в чем их прикол. Статья будет полезна начинающим разработчикам.

Материал рассчитан на начинающих программистов, которые хотят разобраться с тем, что такое декораторы, и с тем, как применять их в своих проектах.

     27.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Создание yastation — консольного клиента для управления Яндекс станцией

Однажды сидя за работой и параллельно слушая музыку на своей Яндекс станции, я обнаружил для себя интересную вещь - я не могу просто взять и переключить трек. Вы спросите: "Как так могло получится?", а я отвечу - вчера я сорвал голос в ожесточенной политической баталии, а телефон, как назло, лежал дальше, чем я мог бы дотянутся. В итоге такая неудачная ситуация побудила меня к созданию очередного велосипеда.

     26.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Разбираем алгоритмы компьютерной графики. Часть 5 – Анимация «Shade Bobs»

Алгоритм, который рассмотрим сегодня, не имеет нормального названия. Иногда его называют "Shade Bobs", а вообще это один из многочисленных алгоритмов генерации "плазмы". Когда что-то на экране видоизменяется и переливается.

Из множества алгоритмов "плазм", представленный экземпляр самый элементарный.

     25.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Сага о моделировании бизнес-процессов на базе конечного автомата (fsm)

Про конечные автоматы (finite state machine, fsm) много кто слышал, но используют их явно в реальных проектах редко. Чаще встречаются конструкции, которые поведением напоминают КА, но ими не являются.
Почему же автоматы обходят стороной и/или изобретают велосипеды, превращая код в спагетти?
По-моему, тут дело в стереотипе: мол, автоматы — это что-то сложное из теоретической математики и к реальной жизни не относится. А применять их можно только в лексических анализаторах или еще чем-нибудь специфичном.

     24.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

BIK Beep – Telegram Bot

В связи с ежедневными вечерними (да ещё и постоянно в разное время) обновлениями расписания в ОГАПОУ «Белгородский индустриальный колледж» необходимо программное обеспечение (ПО), которое будет следить за расписанием и уведомлять при его изменении.

     24.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Как прогнозировать временные ряды с ETNA

В статье расскажу, как быстро и легко анализировать временные ряды с помощью ETNA, зачем временным рядам столько фич, и покажу, что даже простой линейной моделью можно получить хороший результат прогнозирования.

     24.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Что лучше: Spark Structured Streaming или полное прекращение работы прода?

Правильное построение ETL-процессов (преобразования данных) — сложная задача, а при большом объёме обрабатываемых данных неизбежно возникают проблемы с ресурсами. Поэтому нам требуется выискивать новые архитектурные решения, способные обеспечить стабильность расчётов и доступность данных, а при необходимости и масштабируемость — с минимальными усилиями.

Когда я пришел в Ozon, мне пришлось столкнуться с огромным количеством ETL-джоб. Прежде чем применить модель машинного обучения, сырые данные проходят множество этапов обработки. А само применение модели (то, ради чего существует команда) занимает всего 5% времени.

     23.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

C из Python (ctypes) на Android

Ранее я писал статью C/C++ из Python (ctypes), в ней описывается процесс запуска на Linux. На этот раз мне понадобилось повторить это уже на Android. В этой статье речь пойдет о сборке, необходимых инструментах, механизмах отладки и установки.

     23.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Проверка ценников в магазине с помощью YOLOv4-Tiny+EasyOCR

Мы распознавали ценники сети магазинов “Лента” при помощи нейронных сетей для сегментации и OCR и теперь хотим рассказать о том, как проходила работа над проектом и что мы узнали за это время.

     23.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Визуализация данных с помощью веб-фреймворка Dash (часть 2)

В предыдущей части статьи мы разбирали, что такое dash в общем, и создавали одностраничный дэшборд, взяв за основу датасет драгоценных камней с kaggle.

Но! Задачи, которые падают на нас ,не всегда просты и не всегда возможно ограничить себя  одной страницей на Дашборде. В этой статье я покажу, как создать многостраничный дэшборд, используя sidebar в качестве навигационного элемента, и наполнить страницы разного рода контентом.

     22.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Разбираем алгоритмы компьютерной графики. Часть 4 – Анимация «Салют»

Еще немного в копилку красивых эффектов и алгоритмов.

Вы в своей жизни наверняка видели салют, когда в ночном небе взрывает огненный шар и от него во все стороны медленно разлетаются огни.

     21.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи
     21.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Профилирование Python-программ и анализ их производительности

Профилирование — это неотъемлемая часть любых работ по оптимизации кода или производительности программ. Любой опыт, любые знания в сфере оптимизации производительности, которые уже у вас есть, не принесут особой пользы в том случае, если вы не знаете о том, где их применить. В результате оказывается, что поиск узких мест приложений может помочь в деле решения проблем производительности, поможет сделать это быстро и приложив не слишком много усилий.