IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Python 3.5; async/await

Тихо и незаметно (с), вышел Python версии 3.5! И, безусловно, одно из самых интересных нововведений релиза является новый синтаксис определения сопрограмм с помощью ключевых слов async/await, далее в статье об этом. 

Поверхностный просмотр «PEP 0492 — Coroutines with async and await syntax» по началу оставил у меня вопрос «Зачем это надо». Сопрограммы удовлетворительно реализуются на расширенных генераторах и на первый взгляд может показаться, что все свелось к замене yield from на await, а декоратора, создающего сопрограмму на async. Сюда можно добавить и возникающее ощущение, что все это сделано исключительно для использования с модулем asyncio.

     19.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Таинство стандартной библиотеки: слабые ссылки - weakref

Python имеет автоматическое управление памятью: подсчёт ссылок для большинства объектов и сборка мусора для удаления циклов. Память освобождается сразу после того, как была удалена последняя ссылка на объект.
Этот...[Продолжение]

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

Wooey - django-приложение, которое может автоматически создавать UI для скриптов

Wooey позвляет управлять внешними скриптами из Django интерфейса. Это приложение создает UI на основе аргументов необходимых для скрипта, после чего вы можете выполнять скрипт прямо из django-интерфейса.

Демонстрация - https://wooey.herokuapp.com/

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

Memory-Based Shallow Parser (MBSP) - анализатор текстов

MBSP анализатор текст. Проект позволяет совершать все типичные действия

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Анализ логов с помощью Hadoop/Python

Привет, Хабр! В этом посте я хотел бы рассказать вам о том, как мы, Лаборатория новых профессий, вместе с компанией Data-centric Alliance смогли сконструировать несколько лабораторных работ, посвящённых обработке и анализу веб-логов. Эти лабораторные работы являются ключевыми в рамках первого кейса нашей образовательной программы «Специалист по большим данным» и выполняются на основе аудиторных данных DMP Facetz.DCA. Меня зовут Артем Пичугин, и я являюсь её координатором.

Представьте, что вы компания, продающая автомобили. Кому показать рекламу автомобиля? На каких сайтах? Так, чтобы недорого и эффективно? Казалось бы, ответ очевиден: пользователям, которые заходят на страницы покупки автомобилей на сайтах компаний, а также на досках объявлений типа Avito и т д.

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Разворачиваем Flask-приложение на Nginx, используя Gunicorn

Предположим, у вас есть Ubuntu, в котором нужно развернуть Nginx с Flask-приложением. Вам необходимо использовать WSGI сервер, например, Gunicorn. Gunicorn (Green Unicorn) — WSGI HTTP сервер на Python для UNIX систем. Представляю вольный перевод статьи Onur Güzel «How to Run Flask Applications with Nginx Using Gunicorn», где шаг за шагом показано процесс развертывания.

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Функциональный Python: Python — это не Haskell

Идеи функционального программирования довольно популярны, в том числе и в среде программистов на Python, который не является функциональным языком.
В докладе речь пойдёт об особенностях функционального стиля в...[Продолжение]

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

lightfm - реализация LightFM, гибридный алгоритм рекомендаций

Реализация алгоритма описанного в статье arXiv

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Регулярные выражения python

Регуля́рные выраже́ния (англ. regular expressions) — формальный язык поиска и осуществления манипуляций с подстроками в тексте. Так же их называю сокращенно regexes. Проще говоря это шаблон (pattern) для поиска определенной строки(подстроки). Разберем все на примерах.

     17.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

html5ever-python - биндинг html5ever

Высоко производительный браузерный HTML5 парсер. Парсер использует CFFI  

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Внутренности Python: импорт в Питоне

Любая программа использует импорт модулей. Но, как показал беглый опрос, далеко не все программисты представляют, как работает импорт, что содержится в модуле и как этот импорт можно расширять для своих нужд.
...[Продолжение]

     18.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Колонка автора

Полезные библиотеки: gensim - библиотека для моделирования над текстами

Gensim - библиотека Python для моделирования. А точнее, тематическое моделирование документов и извлечения подобия с больших корпусов.
Целевая аудитория - люди занимающиеся обработкой естественного языка (НЛП) и IR...[Продолжение]

     16.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Анализируем 1.7 миллиард комментариев с Reddit с помощью Blaze и Impala

Захватывающая статья про анализ данных. Особенность этой статьи - объем данных. Далеко не на всякой машине такой объем влезит в память.

     16.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Анонс PyCharm Edu 2: простое лучше сложного

Новая версия PyCharm Educational Edition. В этой версии еще больше упрощен интерфейс и многие утилиты.

     16.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Статьи

Отслеживаем мяч на OpenCV

OpenCV - отличная библиотека для обработки изображений и видео. В этой статье будет показано как можно распознать мяч на видео.

     16.09.2015       Выпуск 91 (14.09.2015 - 20.09.2015)       Интересные проекты, инструменты, библиотеки

pycaffe-recurrent - IPython notebook для обучения многослойных LSTM и RNN сетей с Pycaffe

Репозиторий содержит код с которого можно начать погружение в многослойные LSTM и RNN сети