IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     16.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Статьи
     16.10.2017       Выпуск 200 (16.10.2017 - 22.10.2017)       Релизы

lxml - 4.1.0

Мощный и быстрый модуль для обработки XML/HTML. Изменения описаны по ссылке https://allmychanges.com/p/python/lxml/#4.1.0. Скачать можно по ссылке: http://pypi.python.org/pypi/lxml/

     14.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     14.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

Цветы, муха и хорошо отрепетированное случайное машинное обучение

В предыдущей серии я пытался сделать из мухи разумное существо. Коротко — не вышло. Муха упорно не хотела учиться. 

Мухой была маленькая простая нейронная сеть, основанная на умножении матриц, сигмоиде и обратном распространении ошибки. Её учение состояло в распознавании фотографий с цветами.

Напомню, что внутри две сети — первая анализирует кусочки исходного изображения, а вторая работает с матрицей, сложенной из результатов работы первой сетки.

Обучение проходило кое-как, результата не было. Затем, оставив попытки обучения по уважительным причинам (как то — вечер субботы, ночь и утро воскресенья), я все же думал, что делать дальше. Какие-то возможные решения были намечены в конце первой статьи, с них и продолжил.

     14.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     13.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     13.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Релизы
     12.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Релизы
     12.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

Реализация фасетного поиска с помощью Django и PostgreSQL

Фасетный поиск основан на выдаче результата поиска в виде маленькой части найденых данных, а также набора всех значений всех атрибутов искомых документов, которые встречаются в найденном множестве документов. Поиск состоит из многих этапов, на каждом этапе пользователь уточнает значения различных параметров, сужая таким образом размер найденных документов. 

     12.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     12.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

The decorators they won't tell you about

Подробная статья о мощи декораторов в Python

     12.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи
     12.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

Go Python, Go: Stream Processing for Python

Статья о том, как добавить логику stream'ов в Python

     12.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

Как научить свою нейросеть анализировать морфологию

Недавно мы рассказывали про генератор стихов. Одной из особенностей языковой модели, лежащей в его основе, было использование морфологической разметки для получения лучшей согласованности между словами. Однако же у использованной морфоразметки был один фатальный недостаток: она была получена с помощью “закрытой” модели, недоступной для общего использования. Если точнее, выборка, на которой мы обучались, была размечена моделью, созданной для Диалога-2017 и основанной на закрытых технологиях и словарях ABBYY.