IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     11.01.2016       Выпуск 108 (11.01.2016 - 17.01.2016)       Статьи

Рекурентная нейронная сеть в 10 строчек кода оценила отзывы зрителей нового эпизода “Звездных войн”

Hello, Habr! Недавно мы получили от “Известий” заказ на проведение исследования общественного мнения по поводу фильма «Звёздные войны: Пробуждение Силы», премьера которого состоялась 17 декабря. Для этого мы решили провести анализ тональности российского сегмента Twitter по нескольким релевантным хэштегам. Результата от нас ждали всего через 3 дня (и это в самом конце года!), поэтому нам нужен был очень быстрый способ. В интернете мы нашли несколько подобных онлайн-сервисов (среди которых sentiment140 и tweet_viz), но оказалось, что они не работают с русским языком и по каким-то причинам анализируют только маленький процент твитов. Нам помог бы сервис AlchemyAPI, но ограничение в 1000 запросов в сутки нас также не устраивало. Тогда мы решили сделать свой анализатор тональности с блэк-джеком и всем остальным, создав простенькую рекурентную нейронную сеть с памятью. Результаты нашего исследования были использованы в статье “Известий”, опубликованной 3 января.

     11.01.2016       Выпуск 108 (11.01.2016 - 17.01.2016)       Статьи

Использование LSM-движка из SQLite 4 в качестве отдельной NoSQL базы данных с использованием Python

На сегодняшний день две мои самые любимые темы — SQLite и key-value базы данных. И в этот раз я пишу сразу про обе: этот пост посвящён Python-обёртке для используемого в SQLite 4 key-value хранилища на основе LSM.

Разобравшись с исходным кодом SQLite 4 и крохотным заголовочным файлом LSM, я написал python-lsm-db (документация).

     10.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи

Автоматический запуск Libre/OpenOffice в режиме прослушивания из Python

Libre/Open Office предоставляют возможность работы с офисом через UNO API. Для того, чтобы можно было обратиться к офису необходимо запустить его в режиме прослушивания. Например: soffice --accept="socket,host=localhost,port=2002;urp;" Данный подход вполне логичен и понятен с точки зрения разработчиков офиса, но несет ряд неудобств. В частности, нужно самостоятельно запускать Libre/Open Office в режиме прослушивания. Лично мне не понятно, почему разработчики поленились и не предоставили функции запуска офиса. Ну да ладно, было бы все сделано, не нужны были бы программисты. Посему будем решать задачу своими силами. 

     08.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи

Подсчет ссылок в Python

Статья описывает макросы Py_INCREF(x) и Py_DECREF(x)

     08.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи

Разбираемся с cPython - часть 2

В ппрошлом посте мы пропатчили Python. Заменили представление int'а с 10-ричного на 16-ричное. В этом посте мы пойдем дальше и попатчим Python еще. 

     08.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи

Создаем чат на websocket'ах

Статья описывает создание chat roulette на websocket'ах

     07.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи

PyThor- взаимодействуем с R из Python

Статья описывает проект PyThor, который позволяет использовать пакеты R в Python

     07.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи
     06.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи

Незаметные достоинства регулярных выражений в Python

В стандартной библиотеке Python есть немало кошмарных модулей, но этого нельзя сказать о модуле re. Несмотря на его преклонный возраст и многолетнее отсутствие обновлений, я считаю этот модуль одним из лучших среди всех динамических языков.

Python — один из немногих динамических языков, в которых отсутствует встроенная поддержка регулярных выражений, но это компенсируется проработанной базовой системой (с точки зрения API). В то же время он весьма причудлив. К примеру, поведение написанного на Python парсера может вас удивить. Если вы попытаетесь в ходе импорта профилировать Python, то, скорее всего, 90% времени вы проведёте в работе с модулем re.

     04.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи

Решение головоломки Галакуб на Питоне

На новый год купил племяннику головоломку Галакуб. Задача собрать из разных деталей куб размером 4х4х4. Суммарный объём деталей, как раз, 4х4х4. Прежде, чем дарить надо было собрать головоломку. Красивое симметричное решение нашлось достаточно быстро. Но стало интересно единственное это решение или нет. Интуиция подсказывала, что единственное, но хотелось проверить.

Я решил по-быстрому запилить скрипт для перебора всех вариантов. В идеале нужно было успеть до новогодней речи Путина. Ситуация усугублялась тем, что код писался на Макбуке моих родителей. Поставить на него какие-то библиотеки — это задача покруче, чем написать саму программу.

     04.01.2016       Выпуск 107 (04.01.2016 - 10.01.2016)       Статьи

Методы форматирования строк в Python

Статья описывает существующие методы форматирования строк: %, format, f

     03.01.2016       Выпуск 106 (28.12.2015 - 03.01.2016)       Статьи
     02.01.2016       Выпуск 106 (28.12.2015 - 03.01.2016)       Статьи

Разработка сайта на платформе Django-nonrel

В этой статье я хочу рассказать о разработке своего проекта — сайта egaxegax.appspot.com. Поскольку являюсь большим поклонником языка Python, свой сайт я решил создать на популярном фреймворке Django. Чтобы использовать его на бесплатном хостинге appspot.com, адаптировал код для использования NoSQL версии django и платформы Google AppEngine. 

     03.01.2016       Выпуск 106 (28.12.2015 - 03.01.2016)       Статьи
     01.01.2016       Выпуск 106 (28.12.2015 - 03.01.2016)       Статьи

В какой стадии переезд на Python3?

Автор статьи на примере 5 стадий принятия негатива рассматривает переход на Python3

     03.01.2016       Выпуск 106 (28.12.2015 - 03.01.2016)       Статьи

Как обманывать нейронные сети

Статья описывает способ обмана нейронной сети. Нейронная сеть умеет определять хищних/не хищник. 

     03.01.2016       Выпуск 106 (28.12.2015 - 03.01.2016)       Статьи
     30.12.2015       Выпуск 106 (28.12.2015 - 03.01.2016)       Статьи

Numpy и многопроцессорность

Сейчас уже многие используют библиотеку numpy в своих python-программах, поскольку она заметно ускоряет работу с данными и выполнение математических операций. Однако во многих случаях numpy работает в разы медленнее, чем она может… потому что использует только один процессор, хотя могла бы использовать все, что у вас есть.