Собрали в одном месте самые важные ссылки
читайте авторский блог
Сборная солянка без документации
Мощный и быстрый модуль для обработки XML/HTML. Изменения описаны по ссылке https://allmychanges.com/p/python/lxml/#4.1.0. Скачать можно по ссылке: http://pypi.python.org/pypi/lxml/
В предыдущей серии я пытался сделать из мухи разумное существо. Коротко — не вышло. Муха упорно не хотела учиться.
Мухой была маленькая простая нейронная сеть, основанная на умножении матриц, сигмоиде и обратном распространении ошибки. Её учение состояло в распознавании фотографий с цветами.
Напомню, что внутри две сети — первая анализирует кусочки исходного изображения, а вторая работает с матрицей, сложенной из результатов работы первой сетки.
Обучение проходило кое-как, результата не было. Затем, оставив попытки обучения по уважительным причинам (как то — вечер субботы, ночь и утро воскресенья), я все же думал, что делать дальше. Какие-то возможные решения были намечены в конце первой статьи, с них и продолжил.
Фасетный поиск основан на выдаче результата поиска в виде маленькой части найденых данных, а также набора всех значений всех атрибутов искомых документов, которые встречаются в найденном множестве документов. Поиск состоит из многих этапов, на каждом этапе пользователь уточнает значения различных параметров, сужая таким образом размер найденных документов.
Подробная статья о мощи декораторов в Python
Статья о том, как добавить логику stream'ов в Python
Недавно мы рассказывали про генератор стихов. Одной из особенностей языковой модели, лежащей в его основе, было использование морфологической разметки для получения лучшей согласованности между словами. Однако же у использованной морфоразметки был один фатальный недостаток: она была получена с помощью “закрытой” модели, недоступной для общего использования. Если точнее, выборка, на которой мы обучались, была размечена моделью, созданной для Диалога-2017 и основанной на закрытых технологиях и словарях ABBYY.