IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python

     14.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Рисуем красивые трейсбеки, перехватывая исключения в Python

Все мы тратим немало времени на отладку, копаясь в логах или читая трейсбеки (traceback, отчёты о трассировке стека). Любое из этих дел может оказаться сложным и длительным. Этот материал посвящён тому, как сделать трассировку стека и работу с исключениями как можно более простыми и эффективными.

     14.03.2022       Выпуск 430 (14.03.2022 - 20.03.2022)       Статьи

Классификация текста с использованием моделей трансформеров

Модели трансформеров на данный момент являются state-of-the-art решениями в мире обработки естественного языка. Новые, более крупные и качественные модели появляются почти каждый месяц, устанавливая новые критерии производительности по широкому кругу задач. В данной статье мы будем использовать модель трансформера для бинарной классификации текста.

     13.03.2022       Выпуск 429 (07.03.2022 - 13.03.2022)       Статьи

Безопасность веб-приложений

Вася, неплохой веб-разработчик, решил создать свой прекрасный интернет-магазин, который приносил бы ему пассивный доход. Вася набил руку за несколько лет работы веб-разработчиком и считает, что сделать это будет раз плюнуть. Раскруткой и рекламой будет заниматься его друг, поэтому они не будут разобраны в статье этими аспектами Василий не интересуется.

     13.03.2022       Выпуск 429 (07.03.2022 - 13.03.2022)       Статьи

Geo data in Python

Понадобилось мне недавно нарисовать в Python данные на карте, благо в данных есть координаты. Казалось бы, что может быть сложного... Но обо всем по порядку.

 

     10.03.2022       Выпуск 429 (07.03.2022 - 13.03.2022)       Статьи

Доверять Джини или нет: вот в чем вопрос

Коэффициент Джини (или индекс Джини), кривая Лоренца, TPR (true positive rate) и FPR (false positive rate) – одни из самых популярных атрибутов экономических задач, решаемых с помощью машинного обучения. Все они используются для оценки качества модели и, так или иначе, связаны друг с другом. Предлагаю вспомнить, как они рассчитываются.

     08.03.2022       Выпуск 429 (07.03.2022 - 13.03.2022)       Статьи

Анонимизация базы данных или как быть уверенным, что ты не нарушаешь закон “О персональных данных”

В настоящее время практически все ИТ-продукты работают с персональной информацией пользователя: ФИО, телефон, e-mail, паспортные и другие идентифицирующие данные. Для  обеспечения защиты прав и свобод, человека и гражданина при обработке его персональных данных в Российской Федерации существует Федеральный закон от 27.07.2006 N 152-ФЗ “О персональных данных”.

     07.03.2022       Выпуск 429 (07.03.2022 - 13.03.2022)       Статьи

Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 3

Продолжим изучение компьютерного зрения. Начало здесь. Напомню краткое содержание предыдущих уроков. Мы изучили этапы анализ и обработки изображений, установку OpenCV, простейшие действия над изображением, такие как преобразование в черно-белый формат, изменение размеров, накладывание фильтра размытия.

     07.03.2022       Выпуск 429 (07.03.2022 - 13.03.2022)       Статьи

OCR’ing Video Streams

In this tutorial, you will learn how to OCR video streams. This lesson is part 3 of a 4-part series on Optical Character Recognition with Python

     07.03.2022       Выпуск 429 (07.03.2022 - 13.03.2022)       Статьи

Оптимизация использования памяти в Python-приложениях

Когда заходит разговор об оптимизации производительности приложений, обычно основное внимание уделяют лишь скорости процессора и уровню его использования. Редко кого заботят соображения, касающиеся потребления памяти. Ну — до тех пор, пока программа не исчерпает доступную ей RAM. Обычно, оптимизируя работу с памятью, программы защищают от сбоев, вызываемых ошибками, связанными с нехваткой памяти. Но существует и множество других причин для того, чтобы попытаться ограничить потребление памяти приложением.

     06.03.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Скриптинг без скриптинга

Уже давно считается, что многие (если не все) игры или приложения можно улучшить, добавив в них поддержку скриптов.

     04.03.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Основы теории вероятности с помощью Python

Тематика сегодняшнего сообщения – это разбор базовых понятий в теории вероятностей с помощью языка программирования Python.

     04.03.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Databaser. Возвращение легкости стартапа

Первая проблема, с который мы столкнулись – развороты больших баз данных (БД) у разработчиков на локальных машинах. Сегодня мы расскажем об инструменте «Databaser», который на 100% позволяет ее решить.

     03.03.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Tile server на коленке: навигация по старинным картам

Я являюсь full stack разработчиком на культурно-историческом IT портале Königsland, который успешно начал свою работу примерно месяц назад. Этот ресурс посвящается культуре и истории Восточной Пруссии и является своеобразной летописью времен, которая больше всего напоминает вирутальный музей, где можно получить довольно полную информацию об истории этого великого края, а эта информация пополняется по мере возникновения у меня свободного времени.Страницы этой летописи приоткрывают завесу тайны и позволяют получить пользу от современных технологий тем, кто увлекается стариной.

     03.03.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Не изобретая велосипед. Кэширование: рассказываем главные секреты оптимизации доступа к данным

Точно скажу, что костыли и велосипеды не лучшее решение, особенно если мы говорим о кэшировании, а конкретнее, если нам надо оптимизировать метод доступа к данным, чтобы он имел производительность выше, чем на источнике. Я докажу это на нескольких примерах, приведённых в статье, всего за 5 минут.

     02.03.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Откровения про отсутствующий Nested Inline от разработчика с очень маленьким Django

— Стыдно признаться, но в нашей компании мы до сих пор используем Django… Так начинали со мной разговор представители навороченных стендов российских конференций Pycon Russia 2021 и Moscow Python Conf++ 2021, где я выступал с докладами про Django. Эдакий "coming out" без объяснений, почему это стыдно, и зачем в этом надо признаваться. Если уж «Все леди делают это» так давайте говорить об этом, как о чем-то нормальном! Я, например, рассказываю, как делать это в удовольствие и с естественными извращениями. Я про работу с Django, конечно, а вы, о чем подумали? Дальше речь пойдет как раз про извращения. Шок контент и ненормативная лексика.

     01.03.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Сбор данных с обходом капчи посредством PYAUTOGUI, KERAS и TENSORFLOW

Существует большое количество методов для автоматического сбора и обработки больших объемов данных из веб-ресурсов. Однако иногда недоступно извлечение данных с помощью автоматизированного кода, выполняющего GET-запросы с последующим парсингом HTML-кода, и его преобразованием в необходимый формат, также, как и все смежные методы. В таких случаях на помощь может прийти эмулятор действия пользователя («кликер», «бот», «робот»).

     01.03.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Как тестировать сайт на Django. Часть 3. Отправка результата на почту, TestExplorer и декоратор tag

Тесты написаны, тимлид рад, а что дальше-то делать? А дальше – автоматизация и отправка отчёта по тестам. Именно об этом мы поговорим в данной статье, попутно затронув полезный инструмент TestExplorer и декоратор tag.

     28.02.2022       Выпуск 428 (28.02.2022 - 06.03.2022)       Статьи

Multi-Column Table OCR

In this tutorial, you will: Discover a technique for associating rows and columns together Learn how to detect tables of text/data in an image

     27.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Алгоритм поиска самой длинной подстроки палиндрома

Один из самых прекрасных алгоритмов в информатике, который показывает, как можно получить большое ускорение от "вялого" O(n3) до молниеносного1 O(n), просто посмотрев на проблему с другой точки зрения.

     25.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Тематическое моделирование с использованием эмбеддингов BERT

Обработка естественного языка одно из востребованных направлений машинного обучения, которое постоянно развивается. В 2018 году компания Google представила новую модель - BERT, сделавшую прорыв в области обработки естественного языка. Несмотря на то, что сейчас у BERT много конкурентов, включая модификации классической модели (RoBERTa, DistilBERT и др.) так и совершенно новые (например, XLNet), BERT всё ещё остается в топе nlp-моделей.