IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     23.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи

Масштабируемая классификация данных для безопасности и конфиденциальности

Классификация данных на основе контента — это открытая задача. Традиционные системы предотвращения потери данных (DLP) решают эту проблему путем снятия отпечатков с соответствующих данных и мониторинга конечных точек для снятия отпечатков. Учитывая большое количество постоянно меняющихся ресурсов данных в Facebook, этот подход не только не масштабируется, но и неэффективен для определения того, где находятся данные. Эта статья посвящена сквозной системе, построенной для обнаружения чувствительных семантических типов в Facebook в масштабе и автоматического обеспечения хранения данных и контроля доступа.

     23.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи

3D ML. Часть 4: дифференциальный рендеринг

В нескольких предыдущих заметках данной серии мы уже упоминали понятие дифференциального рендеринга. Сегодня пришло время разъяснить что это такое и с чем это едят.

     23.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи

Фоновые задачи на Faust, Часть II: Агенты и Команды

Часть II. Узнаем, как писать агентов, обрабатывающих стрим событий из kafka, а так же как написать команды (обёртка на click).

     22.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи
     22.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи
     22.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи
     22.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи

Как мы оркестрируем процессы обработки данных с помощью Apache Airflow

В нашем департаменте Airflow играет роль оркестратора процессов обработки больших данных, с его помощью мы загружаем в Hadoop данные из внешних систем, обучаем ML модели, а также запускаем проверки качества данных, расчеты рекомендательных систем, различных метрик, А/Б-тестов и многое другое.

     22.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи

Лучшие инструменты с открытым исходным кодом и библиотеки для Deep Learning — ICLR 2020 Experiencebi

Сложно найти на Хабре человека, который не слышал бы про нейронные сети. Регулярные новости о свежих достижениях нейронных сетей заставляют удивляться широкую публику, а также привлекают новых энтузиастов и исследователей. Привлеченный поток специалистов способствует не только еще большим успехам нейронных моделей, но и приводит к развитию инструментов для более удобного использования Deep Learning подходов. Помимо всем известных фреймворков Tensorflow и PyTorch активно развиваются и другие библиотеки, нередко более гибкие, но менее известные.  Эта статья является переводом одного из постов neptune.ai и освещает самые интересные инструменты для глубокого обучения, представленные на конференции по машинному обучения ICLR 2020.

     21.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи
     21.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи

OpenCV: Automatic License/Number Plate Recognition (ANPR) with Python

In this tutorial, you will build a basic Automatic License/Number Plate (ANPR) recognition system using OpenCV and Python.

     21.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Вопросы и обсуждения
     21.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи

Machine learning в анализе логов Netflix

Представьте лог на 2,5 гигабайта после неудачной сборки. Это три миллиона строк. Вы ищете баг или регрессию, которая обнаруживается на миллионной строке. Вероятно, найти одну такую строку вручную просто невозможно. Один из вариантов — diff между последней успешной и упавшей сборкой в надежде на то, что баг пишет в журналы необычные строки. Решение Netflix быстрее и точнее LogReduce — под катом.

     21.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи
     21.09.2020       Выпуск 353 (21.09.2020 - 27.09.2020)       Статьи
     19.09.2020       Выпуск 352 (14.09.2020 - 20.09.2020)       Статьи

HackTheBox. Прохождение Multimaster. Burp+Sqlmap. AD users from MSSQL. Уязвимость в VSCode. AMSI bypass и CVE ZeroLogon

Продолжаю публикацию решений, отправленных на дорешивание машин с площадки HackTheBox.

В данной статье очень много всего. Посмотрим как для удобства совместить Burp Suite и sqlmap, узнаем как получить пользователей домена имея доступ к MSSQL, эксплуатируем уязвимость в Visual Studio Code, блокируем AMSI, выполняем AS-REP Roasting для получения учетных данных и повышаем привилегии из группы Server Operators. А в качестве демонстрации новой уязвимости ZeroLogon, захватим эту же машину другим путем меньше чем за 5 минут.

     20.09.2020       Выпуск 352 (14.09.2020 - 20.09.2020)       Статьи

Собираем данные AlphaVantage с Faust. Часть 1. Подготовка и введение

Не так давно мне пришлось работать над бэкендом высоко нагруженного проекта, в котором нужно было организовать регулярное выполнение большого количества фоновых задач со сложными вычислениями и запросами на сторонние сервисы. Проект асинхронный и до того, как я пришёл, в нём был простой механизм крон-запуска задач: цикл с проверкой текущего времени и запуск групп корутин через gather — такой подход оказался приемлем до момента, пока таких корутин были десятки и сотни, однако, когда их количество перевалило через две тысячи, пришлось думать об организации нормальной очереди задач с брокером, несколькими воркерами и прочим.

     19.09.2020       Выпуск 352 (14.09.2020 - 20.09.2020)       Статьи

Опыт проведения городской школьной олимпиады по программированию

В этой статье я расскажу про опыт проведения городской школьной олимпиады по программированию.