IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     22.08.2022       Выпуск 453 (22.08.2022 - 28.08.2022)       Статьи

4 анти-паттерна pandas и способы борьбы с ними

Pandas — это мощная библиотека для анализа данных, API которой обладает широкими функциональными возможностями. Этот API позволяет решить любую задачу, связанную с обработкой данных, несколькими способами. Некоторые из подходов к решению задач лучше других. Часто бывает так, что пользователи pandas узнают о подходах, не отличающихся особой эффективностью, привыкают к ним и постоянно их применяют. Этот материал посвящён разбору четырёх анти-паттернов pandas и рассказу о приёмах работы, которые стоит использовать вместо них.Автор черпал вдохновение из многих источников, ссылки на которые даны в статье. В частности — из замечательной книги Effective Pandas.

     21.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Все, что вам нужно знать об Airflow DAGs, ч.3 — Проектирование DAG

Поскольку Airflow — это на 100% код, знание основ Python - это все, что нужно, чтобы начать писать DAG. Однако написание эффективных, безопасных и масштабируемых DAG требует учета некоторых моментов, специфичных для Airflow. В этом разделе мы рассмотрим некоторые передовые методы разработки DAG, которые максимально используют возможности Airflow. В целом, большинство лучших практик, которые мы здесь рассматриваем, относятся к одной из двух категорий

     19.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Часть 4. Ищем матчи в Dota 2 по названиям роликов на YouTube с помощью BERT и OpenDota

Представьте, что с одной стороны у вас есть видео на YouTube с интересными моментами из матча по Dota 2. А с другой стороны база данных всех матчей по Dota 2. Как для видео найти соответствующую запись в БД? Этой задачей мы сегодня и займемся.

 

     19.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Суффиксное дерево на python

Суффиксное дерево (Suffix Tree, ST) – это структура данных, которая позволяет "проиндексировать" строку за линейное время от её длины, чтобы потом быстро находить подстроки (за время О(длина искомой подстроки)).

     19.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Расчет и анализ корреляционного отношения средствами Python

Расчет и анализ корреляционного отношения средствами Python.

     17.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Четыре функции для быстрой работы с Big Data

Я часто пользуюсь функциями для работы с большими данными. Они позволяют упросить и ускорить работу. Некоторые я нашел на просторах интернета, другие написал сам. Сегодня хочу поделиться четырьмя из них, может кому-то будет полезно.

     17.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Введение в анализ генетической информации с использованием TensorFlow

Относительная доступность методов секвенирования ДНК и большое количество доступной в открытых источниках генетической информации сделала актуальной разработку нейронных сетей, предназначенных для анализа цепочек ДНК и поиска корреляций между признаками и геномной последовательностью. В статье мы рассмотрим основы кодирования генетической информации и обсудим дополнение от исследовательской команды генетики Google Nucleus для Tensorflow, который позволяет считывать основные форматы кодирования генетической информации и представлять их в виде набора данных, которые могут быть проанализированы с использованием тензорных графов на основе Tensorflow.

     17.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Видео

Построение API с помощью спецификации JSON:API на Python

Спецификация JSON:API позволяет нам строго определить, как ресурсы должны вести себя, что должны и могут делать, а чего им делать нельзя. Спецификация необходима для унификации интерфейса. Благодаря строгим рамкам мы получаем универсальный интерфейс, который можем применять в различных проектах. Различные серверные реализации JSON:API позволяют нам абстрагироваться от слоёв работы с данными, а также сериализации / десериализации.
Слайды: https://moscowpython.ru/meetup/77/api-json-python/
 

     17.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Видео

DRF и моток синей изоленты

Все иногда пишут на Django Rest Framework, я расскажу про наш опыт костылестроения и улучшайзинга

Слайды: https://moscowpython.ru/meetup/77/drf-and-isolenta/

     17.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Видео

Как Django и Alchemy (не) справляются со сложным SQL

Иногда проект перерастает Django ORM, и в игру входит SQLAlchemy. Расскажу, как каждый из них справляется (или нет) с нашей сложной бизнес-логикой. Ещё немного о том, почему мы выбрали SQLAlchemy, а что всё-таки можно было сделать, не выходя из Django.
Слайды: https://moscowpython.ru/meetup/77/django-alchemy/
 

     17.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи
     16.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

#2 Нейронные сети для начинающих. NumPy. MatplotLib. Операции с изображениями в OpenCV

Это вторая статья из серии введения в «Нейронные сети для начинающих». Здесь и далее мы постараемся разобраться с таким понятием — как обработка графических данных, визуализация данных, а также на практике решим пару простых задач.

     16.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Пятничный дебаг: насколько глубока кроличья нора?

Этот текст — первый в цикле историй про эксплуатацию, дебаг и жизнь в обнимку с консолью и мануалом. Искушенного инженера они вряд ли удивят, но для начинающих могут оказаться полезными. Среди них есть короткие и длинные, линейные и запутанные. Постараюсь рассказывать поэтапно, чтобы вы пережили все с точки зрения участника и построили собственные гипотезы. Заодно поговорим об используемых инструментах и попробуем найти во всем этом какую-нибудь мораль.

     16.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Пытаюсь устроиться на работу #1 Тестовое задание на pyZMQ

Эта статья только первая из цикла "прохожу тестовые задания". Подобными заметками я хочу показать другим начинающим программистам, с чем им придется столкнуться при собеседованиях на работу. Сам я изучаю питон (и не только) уже порядка 4 лет, но это только теория с практикой на своих пет-проектах, что, как оказалось, с реальным программированием не имеет ничего общего. Итак, хватит лирики.

     15.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Все, что вам нужно знать об Airflow DAGs, ч.2 — Операторы и Датчики

Первая часть - Все, что вам нужно знать об Airflow DAGs — Основы и расписания

Добро пожаловать в полное руководство по Apache Airflow DAG, представленное командой Astronomer. Эта электронная книга охватывает все, что вам нужно знать для работы с
DAG, от строительных блоков, из которых они состоят, до рекомендаций по
их написанию, динамической генерации, тестированию, отладке и многому
другому. Это руководство, написанное практикующими для практикующих.

     15.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи
     15.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Одна панель, чтобы объединить все визуализации. Panel for Python

Качественная визуализация данных не менее важна для анализа данных, чем методы математической обработки. На сегодняшний день существуют десятки (если не сотни) библиотек для визуализации наборов данных на Python, но иногда в них встречаются уникальные возможности и хотелось бы иметь возможность объединить различные инструменты в единой панели. В статье мы рассмотрим основы библиотеки panel для реализации реактивной модели интерактивных визуализаций и попробуем объединить визуализации из разных библиотек в одном dashboard.

     15.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Эффективное использование any и all в Python

Вот вам задача: надо проверить, входит ли число 200 миллионов в диапазон от 0 до 1 миллиарда. Знаю, что на Python её решение выглядит до крайности примитивно — достаточно воспользоваться функцией any и списковым включением:

     15.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Цифровизация в сельском хозяйстве

В данной серии статей я постараюсь рассказать про большую часть тех вещей, которые присутствуют в цифровизации сельского хозяйства.

Эти статьи предназначены для людей, которым интересна тема агрономии. Возможно вы студент, или уже опытный фермер, в любом случае найдёте для себя что-нибудь интересное или новое. Моя задача объяснить не совсем понятные вещи простым языком.

     15.08.2022       Выпуск 452 (15.08.2022 - 21.08.2022)       Статьи

Любительская почта — чебурнет судного дня

В данной статье описан мой опыт создания sneakernet-сети, мотивация, побудившая написать данное ПО, общее описание работы, бенчмарки, а также ссылки на сторонние ресурсы, где можно почитать документацию и скачать исходный код и готовую скомпилированную сборку.