IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python


Новый материал в ленте
  Topological Sort

A Directed Acyclic Graph (DAG) is a common data structure used to contain a series of related items that must have certain order or dependency. Topological sorting is used to help find where you might start processing to get in order handling of the items in a DAG.


Python Дайджест. Выпуск 208

(11.12.2017 - 17.12.2017)

поделиться выпуском 
Дайджест python,

Статьи

  История победы на международном соревновании по распознаванию документов команды компании SmartEngines

Сегодня мы расскажем о том, как нашей команде из Smart Engines удалось победить на международном конкурсе по бинаризации документов DIBCO17, проводимом в рамках конференции ICDAR. Данный конкурс проводится регулярно и уже имеет солидную историю (он проводится 9 лет), за время которой было предложено множество невероятно интересных и безумных (в хорошем смысле) алгоритмов бинаризации. Несмотря на то, что в своих проектах по распознаванию документов при помощи мобильных устройств мы по возможности не используем подобные алгоритмы, команде показалось, что нам есть что предложить мировому сообществу, и в этом году мы впервые приняли решение участвовать в конкурсе.

  Первые шаги с GitPython

Библиотека для работы с Git репозиториями

  Airflow Workshop: сложные DAG’и без костылей

Airflow — это opensource-библиотека для разработки ETL/ELT-процессов. Отдельные задачи объединяются в периодически выполняемые цепочки задач — даги (DAG — Directed Acyclic Graph).

Как правило, 80 % проекта на Airflow — это стандартные DAG’и. В моей статье речь пойдёт об оставшихся 20 %, которые требуют сложных ветвлений, коммуникации между задачами — словом, о DAG’ах, нуждающихся в нетривиальных алгоритмах.

  Запускаем django-приложение в Docker на Vagrant под Windows

Уже несколько лет Docker был на слуху у меня, но никак не доводилось с ним поработать. А тут как раз менеджменту захотелось поменять свой стек. Начали говорить такие слова как Docker, контейнеры и облака. Чем не повод изучить что-то новое? Я работаю DevOps инженером на радио. Мой список технологий очень прост: Octopus Deploy + TeamCity + и тележка самописных приложений. Работает безотказно.

  Корреляция IQ с нашей жизнью(Feature ranking)

Порой у каждого из нас возникает вопрос, который не даёт нам покоя. И как правило ответ на такой вопрос можно получить лишь проанализировав опыт большого количества людей. У меня возник такой вопрос: «Какие факторы влияют на IQ и является ли он хоть чуточку преимуществом?». Конечно, читатель может воскликнуть, что всем давно уже все известно и можно прочитать статьи на эту тему. В какой-то степени вы окажитесь правы, но увы, статьи на тему IQ оказались крайне противоречивыми и навязали мне еще большее количество вопросов. Поэтому я и решил провести своё скромное исследование на эту тему. 

  Python Meetup 14.11.2017: Python в Порту, Aiohttp и снова тесты

После долгого перерыва, блудная питоновка снова в деле! 14 ноября состаялась очередная встреча минского сообщества Python-разработичков Python Meetup. В этот раз доклады представили:

— Как я нечаянно стал главным по питону в Порту / Роман Иманкулов, Doist
— The test which will save your day / Иван Стяжкин, DataRobot 
— Django и Aiohttp / Юлия Темушева, Wargaming
— Блицдоклад: распространенные ошибки программирования на Python / Юрий Красовский

  Как взломать систему CAPTCHA за 15 минут с Machine Learning

Взламываем самый популярный Wordpress CAPTCHA Plug-in.

  Django Admin Range-Based Date Hierarchy django

Как улучшить производительность выборок с датами

  Scraping, Geocoding, and Mapping Points with Scrapy, Geopy, and Leaflet

Парсинг и отображение на карте точек

  Предсказываем увольнения работников

Пытаемся предугадать увольнение работника

  Preview документов в программе на Python

В одной из систем, к которым я имею отношение, doc-файлы складываются в базу данных.
Мне стало интересно, можно ли пристроить в свою программку, работающую с базой, просмотр этих файлов.

Видео

  Как мы Scrum масштабировали

"Почему возникла потребность в масштабировании Scrum? Чем нам помог фреймворк LeSS? С какими проблемами мы столкнулись и как их преодолели?"

Слайды: http://www.moscowpython.ru/meetup/50/scrum-scale/

  Pipfile, pipenv, pip… what?!

"Python имеет всеми нами любимый пакетный менеджер pip, но прогресс не стоит на месте и сообщество сделало новый удобный иструмент pipenv. Давайте посмотрим на него и ответим пора ли на него переходить?"

Слайды: http://www.moscowpython.ru/meetup/50/pip-what/

  Практический Hypothesis

"На MoscowPython 33 я уже рассказывал в общих чертах про состояние property-тестирования в Python и коротко про Hypothesis. Предлагаю продолжить, но уже по существу. В этом докладе я на примерах покажу, как эффективно применять Hypothesis, находить неочевидные баги и повышать качество ваших тестов".

Слайды: http://www.moscowpython.ru/meetup/50/practical-hypothesis/

Интересные проекты, инструменты, библиотеки

  django-AB-project - A/B тестирование в Django (Split testing)

Небольшой проект для a/b тестирования, вводится два пути к html файлам, и если тестирование запущено, каждому пользователю будет показан один из файлов. Если больше пользователей заполняли форму или совершали нужное действие на одной из двух вариантов страниц, будет показан какой коэффициент успеха имеет страница, и будет ясно какая из низ будет лучше восприниматься пользователями.

Релизы

  PyCharm 2017.3.1 PyCharm IDE

Немного фиксов и улучшений

  django-money 0.12.3

Django-money bugfix release 0.12.3