IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     19.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Клеточные автоматы в Python Часть 1: Как вы думаете, это игра жизнь?

Первая статья из цикла "Клеточные автоматы". Введение - что это, зачем это и как это

     20.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Таинство стандартной библиотеки: модуль operator

Модуль operator содержит набор функций, соответствующих операторам Python.
Вот некоторые функции:
operator.add(a, b) # суммирует два значения
...[Продолжение]

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Продвинутое использование регулярных выражений

Статья описывает практику использования регулярных выражений. Рассматриваются различные небольшие хитрости, которые упрощают работу с данной техникой.

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Python 3.5; async/await

Тихо и незаметно (с), вышел Python версии 3.5! И, безусловно, одно из самых интересных нововведений релиза является новый синтаксис определения сопрограмм с помощью ключевых слов async/await, далее в статье об этом. 

Поверхностный просмотр «PEP 0492 — Coroutines with async and await syntax» по началу оставил у меня вопрос «Зачем это надо». Сопрограммы удовлетворительно реализуются на расширенных генераторах и на первый взгляд может показаться, что все свелось к замене yield from на await, а декоратора, создающего сопрограмму на async. Сюда можно добавить и возникающее ощущение, что все это сделано исключительно для использования с модулем asyncio.

     19.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Таинство стандартной библиотеки: слабые ссылки - weakref

Python имеет автоматическое управление памятью: подсчёт ссылок для большинства объектов и сборка мусора для удаления циклов. Память освобождается сразу после того, как была удалена последняя ссылка на объект.
Этот...[Продолжение]

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

Wooey - django-приложение, которое может автоматически создавать UI для скриптов

Wooey позвляет управлять внешними скриптами из Django интерфейса. Это приложение создает UI на основе аргументов необходимых для скрипта, после чего вы можете выполнять скрипт прямо из django-интерфейса.

Демонстрация - https://wooey.herokuapp.com/

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

Memory-Based Shallow Parser (MBSP) - анализатор текстов

MBSP анализатор текст. Проект позволяет совершать все типичные действия

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Анализ логов с помощью Hadoop/Python

Привет, Хабр! В этом посте я хотел бы рассказать вам о том, как мы, Лаборатория новых профессий, вместе с компанией Data-centric Alliance смогли сконструировать несколько лабораторных работ, посвящённых обработке и анализу веб-логов. Эти лабораторные работы являются ключевыми в рамках первого кейса нашей образовательной программы «Специалист по большим данным» и выполняются на основе аудиторных данных DMP Facetz.DCA. Меня зовут Артем Пичугин, и я являюсь её координатором.

Представьте, что вы компания, продающая автомобили. Кому показать рекламу автомобиля? На каких сайтах? Так, чтобы недорого и эффективно? Казалось бы, ответ очевиден: пользователям, которые заходят на страницы покупки автомобилей на сайтах компаний, а также на досках объявлений типа Avito и т д.

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Разворачиваем Flask-приложение на Nginx, используя Gunicorn

Предположим, у вас есть Ubuntu, в котором нужно развернуть Nginx с Flask-приложением. Вам необходимо использовать WSGI сервер, например, Gunicorn. Gunicorn (Green Unicorn) — WSGI HTTP сервер на Python для UNIX систем. Представляю вольный перевод статьи Onur Güzel «How to Run Flask Applications with Nginx Using Gunicorn», где шаг за шагом показано процесс развертывания.

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Функциональный Python: Python — это не Haskell

Идеи функционального программирования довольно популярны, в том числе и в среде программистов на Python, который не является функциональным языком.
В докладе речь пойдёт об особенностях функционального стиля в...[Продолжение]

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

lightfm - реализация LightFM, гибридный алгоритм рекомендаций

Реализация алгоритма описанного в статье arXiv

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Регулярные выражения python

Регуля́рные выраже́ния (англ. regular expressions) — формальный язык поиска и осуществления манипуляций с подстроками в тексте. Так же их называю сокращенно regexes. Проще говоря это шаблон (pattern) для поиска определенной строки(подстроки). Разберем все на примерах.

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

html5ever-python - биндинг html5ever

Высоко производительный браузерный HTML5 парсер. Парсер использует CFFI  

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Внутренности Python: импорт в Питоне

Любая программа использует импорт модулей. Но, как показал беглый опрос, далеко не все программисты представляют, как работает импорт, что содержится в модуле и как этот импорт можно расширять для своих нужд.
...[Продолжение]

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Полезные библиотеки: gensim - библиотека для моделирования над текстами

Gensim - библиотека Python для моделирования. А точнее, тематическое моделирование документов и извлечения подобия с больших корпусов.
Целевая аудитория - люди занимающиеся обработкой естественного языка (НЛП) и IR...[Продолжение]

     16.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Анализируем 1.7 миллиард комментариев с Reddit с помощью Blaze и Impala

Захватывающая статья про анализ данных. Особенность этой статьи - объем данных. Далеко не на всякой машине такой объем влезит в память.