IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python

     24.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Что лучше: Spark Structured Streaming или полное прекращение работы прода?

Правильное построение ETL-процессов (преобразования данных) — сложная задача, а при большом объёме обрабатываемых данных неизбежно возникают проблемы с ресурсами. Поэтому нам требуется выискивать новые архитектурные решения, способные обеспечить стабильность расчётов и доступность данных, а при необходимости и масштабируемость — с минимальными усилиями.

Когда я пришел в Ozon, мне пришлось столкнуться с огромным количеством ETL-джоб. Прежде чем применить модель машинного обучения, сырые данные проходят множество этапов обработки. А само применение модели (то, ради чего существует команда) занимает всего 5% времени.

     23.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

C из Python (ctypes) на Android

Ранее я писал статью C/C++ из Python (ctypes), в ней описывается процесс запуска на Linux. На этот раз мне понадобилось повторить это уже на Android. В этой статье речь пойдет о сборке, необходимых инструментах, механизмах отладки и установки.

     23.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Проверка ценников в магазине с помощью YOLOv4-Tiny+EasyOCR

Мы распознавали ценники сети магазинов “Лента” при помощи нейронных сетей для сегментации и OCR и теперь хотим рассказать о том, как проходила работа над проектом и что мы узнали за это время.

     23.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Визуализация данных с помощью веб-фреймворка Dash (часть 2)

В предыдущей части статьи мы разбирали, что такое dash в общем, и создавали одностраничный дэшборд, взяв за основу датасет драгоценных камней с kaggle.

Но! Задачи, которые падают на нас ,не всегда просты и не всегда возможно ограничить себя  одной страницей на Дашборде. В этой статье я покажу, как создать многостраничный дэшборд, используя sidebar в качестве навигационного элемента, и наполнить страницы разного рода контентом.

     22.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Разбираем алгоритмы компьютерной графики. Часть 4 – Анимация «Салют»

Еще немного в копилку красивых эффектов и алгоритмов.

Вы в своей жизни наверняка видели салют, когда в ночном небе взрывает огненный шар и от него во все стороны медленно разлетаются огни.

     21.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи
     21.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Профилирование Python-программ и анализ их производительности

Профилирование — это неотъемлемая часть любых работ по оптимизации кода или производительности программ. Любой опыт, любые знания в сфере оптимизации производительности, которые уже у вас есть, не принесут особой пользы в том случае, если вы не знаете о том, где их применить. В результате оказывается, что поиск узких мест приложений может помочь в деле решения проблем производительности, поможет сделать это быстро и приложив не слишком много усилий.

     21.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Платим пользователям, не платим за рекламу, или подключение системы вознаграждений на сайт в 3 простых шага

Для того чтобы получить полезный трафик не обязательно платить за размещение рекламных постов и баннеров на сторонних площадках и тратить на это значительную часть своего рекламного бюджета. Уже давно вошли в моду системы лояльности, которые позволяют финансово вознаграждать своих пользователей за активность в приложении. Это своего рода внутренний арбитраж трафика: мы закупаем активность своих же пользователей в обход посредников. Чтобы это реализовать потребуется несколько часов свободного времени и капелька желания.

     21.03.2022       Выпуск 431 (21.03.2022 - 27.03.2022)       Статьи

Парсинг сайта с помощью PYTHON + SELENIUM

В этой статье, на примере моей задачи, рассмотрим, как можно извлечь большой объем данных с сайта ГИББД и с помощью какого инструмента. Это может быть полезно для финансовых компаний, которые принимают автомобили в качестве залога. Итак, мне необходимо было получить информацию о владельцах и периодах владения автомобилями, чтобы определить были ли изменения в конкретном периоде. Данная информация есть на официальном сайте ГИБДД.рф. На входе было дано 70 тысяч VIN номеров автомобилей, по которым и возможно было сделать эту выгрузку.

     20.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Разбираем алгоритмы компьютерной графики. Часть 3 – анимация «Пламя»

Рассмотрим алгоритм рисования простейшего пламени. Придуман он довольно давно и использовался в огромном количестве демо и игр.

     20.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

«Живые» кликабельные обои на Python'е?

Для начала хотелось просто сделать вывод дня недели и времени на центр экрана. Так я и поступил, но этого стало мало и я решил выводить нагрузку на ЦП и ОЗУ. Но приходилось часто обновлять рабочий стол (каждую секунду), а это оказалось не лучшая идея из-за нагрузки на ЦП, да и с моим то i3.

     20.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Оптическое распознавание символов с помощью Rust и WebAssembly

После переписывания Cyberscore я захотел отправить на сайт какие-нибудь результаты. Последнее, во что я играл, это Pokémon Legends: Arceus, по которой на Cyberscore есть около 3000 таблиц результатов. Я не собирался отправлять столько рекордов вручную, поэтому начал придумывать инструмент для автоматизации этого процесса.

     20.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Создание APP для самотестирования (Python)

Недавно от знакомых прилетела задачка написать программу для самотестирования. Порылся в инете, думал в лёгкую найду наработки, но ничего кроме платных и бесплатных конструкторов тестов не нашёл (может плохо искал, кто знает…). Мне показалось, что устанавливать какие-то инородные проги, а потом ещё туда все вопросы ручками забивать - совсем некрасиво. Так родилось приложение для самотестирования, написанное на Python с помощью GUI библиотеки Tkinter.

     19.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 4

На прошлом уроке мы познакомились с медианной фильтрацией, кастомными фильтрами и выделением контуров. Напомню, что выделенный контур можно использовать для поиска области интересов на изображении и для нахождения различных фич. В частности, вот что можно далее сделать с контуром

     18.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Разбираем алгоритмы компьютерной графики. Часть 2 — «Туннель из демо «Second Reality»»

В 1993 году на демопати Assembly, которая проходит в Финляндии, команда Future Crew презентовала свою новую работу «Second Reality».

(хороший разбор исходников этой демо можно найти здесь же на Хабре, по этой ссылке«Анализ кода демо Second Reality»)

     17.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Телеграм как инструмент для оценки стоимости предметов

Телеграм снова стал очень популярен. Наше дело маленькое - получить от этого мессенджера максимум личной выгоды с учетом фактора времени. Я не буду уделять большого внимания библиотекам или деталям реализации, а предложу только общую концепцию довольно комплексной системы, которая кому-то может оказаться полезной.

Раньше я уже писал про использование телеграм бота для мониторинга состояния своих ресурсов, сейчас я бы хотел уделить особое внимание механике внедрения UI телеграм бота в процессе оценки предметов. Так как проект ориентирован на предметы старины, которые несут историческую информационную нагрузку, оценивать мы будем именно их.

     16.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Разбор задачи Титаник на Kaggle (Baseline)

Задача Титаника одна из самых известных платформы Kaggle. Рано или поздно, любой начинающий специалист по данным возьмется за ее решение. Здесь я покажу на пальцах: как проверить гипотезы, найти зависимости и реализовать предсказание только на основе аналитики.

     15.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Разбираем алгоритмы компьютерной графики. Часть 1 — «Starfield Simulation»

Этой небольшой заметкой я хочу начать цикл статей посвященных алгоритмам компьютерной графики. Причем, не аппаратным тонкостям реализации этой самой графики, а именно алгоритмической составляющей.

     14.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи
     14.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Improving Text Detection Speed with OpenCV and GPUs

In this tutorial, you will learn to improve text detection speed with OpenCV and GPUs.