IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     20.12.2017       Выпуск 209 (18.12.2017 - 24.12.2017)       Статьи

Генерируем заголовки фейковых новостей в стиле Ленты.ру

Сравниваем 2 подхода к генерации текста c помощью нейронных сетей: Char-RNN vs Word Embeddings + забавные примеры в конце.

Когда становится совсем нечего читать, открывать книгу не хочется, все статьи на Хабре прочитаны, все нотификации на телефоне обработаны, и даже просмотрен спам в ящиках, я открываю Ленту.ру. У моей жены — профессионального журналиста — в такие моменты начинается аллергия, и понятно, почему. После того, как в 2014 году из Ленты ушла старая команда, уровень желтизны издания пошел вверх, а качество текста и редактуры — вниз. Со временем, периодически по инерции продолжая читать Ленту, я стал замечать, что модели заголовков новостей повторяются: «Обнаружено [вставить псевдо-сенсацию]», «Путин [что-то сделал]», «Безработный москвич [описание его приключений]» и так далее. Это была первая вводная.

     20.12.2017       Выпуск 209 (18.12.2017 - 24.12.2017)       Статьи

Материалы открытого курса OpenDataScience и Mail.Ru Group по машинному обучению и новый запуск

Недавно OpenDataScience и Mail.Ru Group провели открытый курс машинного обучения. В прошлом анонсе много сказано о курсе. В этой статье мы поделимся материалами курса, а также объявим новый запуск.

     20.12.2017       Выпуск 209 (18.12.2017 - 24.12.2017)       Статьи

Smart IDReader SDK — как написать Telegram-бота для распознавания документов на Python за 5 минут

Мы, Smart Engines, продолжаем цикл статей про то, как встроить наши технологии распознавания (паспортов, банковских карт и других) в ваши приложения. Ранее мы уже писали про встраивание на iOS и Android, а сегодня мы расскажем про то, как работать с Python-интерфейсом библиотеки распознавания Smart IDReader и напишем простого Telegram-бота.

 

Кстати, список поддерживаемых нами языков программирования расширился и теперь включает C++, C, C#, Objective-C, Swift, Java, Python, а также такие эзотерические языки, как Visual Basic и, разумеется, PHP. Как и раньше, мы поддерживаем все популярные и многие непопулярные операционные системы и архитектуры, а наши бесплатные приложения доступны для скачивания из App Store и Google Play.

По традиции, демо-версия Smart IDReader SDK для Python вместе с исходным кодом реализации Telegram-бота выложены на Github и доступны по ссылке.

     19.12.2017       Выпуск 209 (18.12.2017 - 24.12.2017)       Статьи
     18.12.2017       Выпуск 209 (18.12.2017 - 24.12.2017)       Статьи
     18.12.2017       Выпуск 209 (18.12.2017 - 24.12.2017)       Статьи

Docker: остановить контейнеры которые работают больше недели Docker

Удаление контейнеров которые работают больше недели с помощью Python

     16.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

Preview документов в программе на Python

В одной из систем, к которым я имею отношение, doc-файлы складываются в базу данных.
Мне стало интересно, можно ли пристроить в свою программку, работающую с базой, просмотр этих файлов.

     15.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи
     14.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи
     14.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

Первые шаги с GitPython

Библиотека для работы с Git репозиториями

     14.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

Scraping, Geocoding, and Mapping Points with Scrapy, Geopy, and Leaflet

Парсинг и отображение на карте точек

     14.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

Django Admin Range-Based Date Hierarchy django

Как улучшить производительность выборок с датами

     14.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

Предсказываем увольнения работников

Пытаемся предугадать увольнение работника

     14.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

Как взломать систему CAPTCHA за 15 минут с Machine Learning

Взламываем самый популярный Wordpress CAPTCHA Plug-in.

     14.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

История победы на международном соревновании по распознаванию документов команды компании SmartEngines

Сегодня мы расскажем о том, как нашей команде из Smart Engines удалось победить на международном конкурсе по бинаризации документов DIBCO17, проводимом в рамках конференции ICDAR. Данный конкурс проводится регулярно и уже имеет солидную историю (он проводится 9 лет), за время которой было предложено множество невероятно интересных и безумных (в хорошем смысле) алгоритмов бинаризации. Несмотря на то, что в своих проектах по распознаванию документов при помощи мобильных устройств мы по возможности не используем подобные алгоритмы, команде показалось, что нам есть что предложить мировому сообществу, и в этом году мы впервые приняли решение участвовать в конкурсе.

     13.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

Python Meetup 14.11.2017: Python в Порту, Aiohttp и снова тесты

После долгого перерыва, блудная питоновка снова в деле! 14 ноября состаялась очередная встреча минского сообщества Python-разработичков Python Meetup. В этот раз доклады представили:

— Как я нечаянно стал главным по питону в Порту / Роман Иманкулов, Doist
— The test which will save your day / Иван Стяжкин, DataRobot 
— Django и Aiohttp / Юлия Темушева, Wargaming
— Блицдоклад: распространенные ошибки программирования на Python / Юрий Красовский

     13.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи
     13.12.2017       Выпуск 208 (11.12.2017 - 17.12.2017)       Статьи

Запускаем django-приложение в Docker на Vagrant под Windows

Уже несколько лет Docker был на слуху у меня, но никак не доводилось с ним поработать. А тут как раз менеджменту захотелось поменять свой стек. Начали говорить такие слова как Docker, контейнеры и облака. Чем не повод изучить что-то новое? Я работаю DevOps инженером на радио. Мой список технологий очень прост: Octopus Deploy + TeamCity + и тележка самописных приложений. Работает безотказно.