IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     10.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

Строим Data Pipeline на Python и Luigi

В эпоху data-intensive приложений рядовым разработчикам всё чаще приходится сталкиваться с задачами по обработке и анализу данных. Ещё десять лет назад данные большинства проектов могли уместиться на жестком диске одного компьютера в какой-нибудь реляционной базе данных типа MySQL. А задачи по извлечению и обработке хранящихся данных решались за счёт непростых (или простых) SQL запросов. С тех пор мир информационных технологий значительно поменялся. С приходом Internet of Things, мобильных телефонов и дешевого мобильного интернета, объем генерируемых данных вырос в десятки тысяч раз. Ежедневно в мире генерируются эксабайты данных. Анализировать такой поток информации вручную, а тем более извлекать полезные для бизнеса или науки данные, практически невозможно. Но технологии как и время не стоят на месте, появляются новые инструменты, наука двигает прогресс. Если вы хоть чуточку следите за новостями из мира высоких технологий, то фразы "биг дата", "машинное обучение", "глубокое обучение" вас не испугают. С приходом больших данных появились новые профессии и специализации такие как Data Scientist/Analyst (по-русски аналитик данных), Data Engineer. Задачи этих ребят тесно связаны с обработкой, анализом и хранением "нефти 21 века", т.е. информации. Но насколько эффективно они выполняются?

     09.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     09.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     09.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

Как получать оповещения от Jupyter notebook в Telegram?

Довольно просто. Нам понадобится свой телеграм-бот, один пакет и одна строчка кода

     09.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     09.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

Простая Scada на Python (продолжение)

Развивая тему предыдущей статьи, опишу некоторые функции для формирования объектов мнемосхемы простой SCADA программы выполненной на Python.

Объекты визуально отображают состояние аналоговых измеряемых величин из регистров
READ_INPUT_REGISTERS или READ_HOLDING_REGISTERS. Используется библиотека Tkinter.
Всего реализовано 3 объекта: горизонтальный слайдер, вертикальный слайдер и стрелочный индикатор. Отдельно описывается построение динамического тренда.

     09.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     08.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи

Что делать, если Instagram не дал доступ к API? Дополнение

Ни для кого не секрет, что самая популярная и прибыльная площадка для рекламы, бизнеса и прочего — Instagram. Почему им стал именно сервис, в котором по началу можно было загружать только картинки определённого размера (соотношение сторон имеется ввиду) и не было абсолютно ничего, что было в тогдашних соцсетях — совсем непонятно, но факт есть факт. Ввиду чего все стараются проникнуть на площадку Instagram и захватить оттуда наибольшее количество аудитории, и делают, это, конечно же, не вручную. А за этим следует, что Instagram жёстко блокирует доступ для ботов, спамеров и прочему, дабы сеть оставалась чистой.

     08.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи

Используйте лучшие CLI утилиты

Стандартные CLI не всегда хороши, пользуйтесь лучшими!

     07.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи

Как отличать птиц от цветов. Или цветы от птиц

В качестве программы выходного дня мне захотелось поиграться с как бы «нейронной» сетью (спойлер — в ней нет нейронов). А чтобы потом не было мучительно больно за бесцельно прожитые годы часы, я подумал, что зря мы его кормим, пусть пользу приносит — пусть заодно эта сетка разберет домашний фотоархив и хотя бы разложит фотографии цветов в отдельную папку.

     06.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи
     06.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи

Airflow — инструмент, чтобы удобно и быстро разрабатывать и поддерживать batch-процессы обработки данных

В этой статье я хочу рассказать об одном замечательном инструменте для разработки batch-процессов обработки данных, например, в инфраструктуре корпоративного DWH или вашего DataLake. Речь пойдет об Apache Airflow (далее Airflow). Он несправедливо обделен вниманием на Хабре, и в основной части я попытаюсь убедить вас в том, что как минимум на Airflow стоит смотреть при выборе планировщика для ваших ETL/ELT-процессов.

     06.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи

Торговый робот для веб-дизайнеров

Написание торговых роботов, как правило, достаточно трудоемкая задача — помимо понимания принципов торговли (равно как и представления о том, как та или иная стратегия выглядит), необходимо знать и уметь работать с протоколами, используемыми для торговли. Вкратце — существуют две основные группы протоколов, которые предоставляются биржей или брокерами: FIX, в котором без бутылки не разобраться, и проприетарный бинарный протокол, который редко бывает лучше. Это приводит к одной из двух проблем: либо код выглядит так, что любой джуниор схватится за голову, либо хороший, красивый код, который умеет делать примерно ничего (а то, что умеет, делает с разными неожиданными проблемами).

     06.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи

Как настроить логирование в Django

Настройка логов и их внешнего вида в Django

     05.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи
     05.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи

Как развернуть / отразить фото вPython

Короткая статья про использование Pillow

     05.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи
     05.10.2017       Выпуск 198 (02.10.2017 - 08.10.2017)       Статьи

Django ORM — медленный? Оптимизируем (хардкорно) Django

Наступила осень, и, несмотря на хорошую погоду, наши зрители потянулись за новым видеоконтентом. Бекенд-серверы, обслуживающие эмбеды с видео, стали упираться в CPU. С криками "а-а-а" прибежали системные администраторы и начали отбирать у отдела разработки ноутбуки и десктопы, грозясь поставить их в датацентры "на усиление". Разработке это конечно всё не понравилось и все поувольнялись с этой хренью решили что-нибудь сделать.