IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     31.07.2017       Выпуск 189 (31.07.2017 - 06.08.2017)       Статьи

Машинное обучение для страховой компании: Оптимизация модели

Выходим на финишную прямую. Чуть больше двух месяцев назад я делилась с вами вводной статьёй о том, для чего нужно машинное обучение в страховой компании и как проверялась реалистичность самой идеи. После чего мы поговорили о тестировании алгоритмов. Сегодня будет последняя статья из серии, в которой вы узнаете об улучшении модели через оптимизацию алгоритмов и их взаимодействие.

     31.07.2017       Выпуск 189 (31.07.2017 - 06.08.2017)       Статьи

Интерфейс vs interface

Одним из принципов объектно-ориентированного проектирования является программирование на уровне интерфейса, а не на уровне реализации. Видимо, из-за того что код в книгах и статьях по проектированию представлен преимущественно на Java, программисты на других языках, особенно с динамической типизацией, испытывают трудности с переносом знаний из этих книг и статей на свой рабочий язык программирования.

     27.07.2017       Выпуск 188 (24.07.2017 - 30.07.2017)       Статьи

Призрак локомотива или биржевой рынок через призму корреляций

В этой статье будет продемонстрирована техника обработки информации по биржевым котировкам с помощью пакета pandas (python), а также изучены некоторые «мифы и легенды» биржевой торговли посредством применения методов математической статистики. Попутно кратко рассмотрим особенности использования библиотеки plotly

     27.07.2017       Выпуск 188 (24.07.2017 - 30.07.2017)       Статьи

SOAP и REST сервисы с помощью Python-библиотеки Spyne


В данной статье я хочу рассказать о замечательной Python-библиотеке Spyne. 
Мое знакомство с Spyne началось в тот момент, когда передо мной поставили задачу написать Веб-сервис, который будет принимать и отдавать запросы через SOAP-протокол. Немного погуглив я наткнулся на Spyne, которая является форком библиотеки soaplib. А еще я был удивлен, насколько мало русскоязычной информации встречается о данной библиотеке. 

     25.07.2017       Выпуск 188 (24.07.2017 - 30.07.2017)       Статьи

Автоматизация IP-сети. Часть3 – Мониторинг TCP аномалий

В предыдущей статье рассмотрен мониторинг скорости открытия Веб ресурсов. В качестве параллельного процесса при измерении скорости, для более глубокого понимания возможных причин низкой скорости открытия Веб страниц, было бы интересно провести измерение TCP аномалий. Эту задачу попробуем решить в этой статье.
TCP аномалиями будем считать пакеты, которые свидетельствуют о потери информации в процессе передачи. Пожалуй, наиболее популярным инструментом глубокого анализа сетевого трафика, является утилита Wireshark и ее консольная версия tshark. Поэтому в качестве исходного анализатора будем рассматривать именно ее. 

     25.07.2017       Выпуск 188 (24.07.2017 - 30.07.2017)       Статьи

Как научить свою нейросеть генерировать стихи

Когда-то в школе мне казалось, что писать стихи просто: нужно всего лишь расставлять слова в нужном порядке и подбирать подходящую рифму. Следы этих галлюцинаций (или иллюзий, я их не различаю) встретили вас в эпиграфе. Только это стихотворение, конечно, не результат моего тогдашнего творчества, а продукт обученной по такому же принципу нейронной сети.

     24.07.2017       Выпуск 188 (24.07.2017 - 30.07.2017)       Статьи

Рейтинг языков программирования 2017 от IEEE Spectrum

На прошлой неделе журнал IEEE Spectrum опубликовал интерактивный рейтинг языков программирования. Давайте узнаем, на каком месте Python.

     23.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Использование VK Streaming API с оповещением в Telegram

Вконтакте запустил Streaming API, инструмент для получения публичных данных из ВКонтакте по заданным ключевым словам. 

ВК сам присылает новый подходящий контент по мере его появления. Таким образом можно получать интересующие записи без вступление в десятки групп, сразу после публикации.

Давайте напишем бота для телеграмма с оповещением о записях в ВК.

     21.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Британские спутниковые снимки 2: Как все было на самом деле

Сразу оговорюсь, что данный пост не несет большой технической нагрузки и должен восприниматься исключительно в режиме «пятничной истории». Кроме того, текст насыщен английскими словами, какие-то из них я не знаю как перевести, а какие-то переводить просто не хочется.

     20.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Getsploit: поиск и загрузка эксплойтов по агрегированной базе данных

Когда я думал над дальнейшим вектором развития Vulners, я обратил внимание на наших старших братьев — базу данных Exploit-DB. Одной из основных утилит в их арсенале является searchsploit. Это консольная утилита, которая позволяет искать эксплойты по пользовательским поисковым запросам и сразу же получать их исходные коды. Она является базовой частью Kali Linux и оперирует данными по эксплойтам из базы Exploit-DB. Что самое "вкусное", что утилита умеет работать с локальной базой и ты можешь всегда взять ее с собой. Так чем же мы хуже? Мы собрали в Vulners не только коллекцию эксплойтов из Exploit-DB, но и Packet Storm, 0day.today, Seebug, Zero Science Lab и многих других. Что же, давайте изобретем новый велосипед с преферансом и поэтессами.

     19.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

«Функция getsizeof не такая» или «Информация устаревает»

Об изменении в getsizeof и коференции PyCon Russia 2017.

     18.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Яндекс открывает технологию машинного обучения CatBoost

Яндекс выложил в open source собственную библиотеку CatBoost, разработанную с учетом многолетнего опыта компании в области машинного обучения. С ее помощью можно эффективно обучать модели на разнородных данных, в том числе таких, которые трудно представить в виде чисел (например, виды облаков или категории товаров). Исходный код, документация, бенчмарки и необходимые инструменты уже опубликованы на GitHub под лицензией Apache 2.0.

     18.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

QML: как легко получать футболки в конкурсах mail.ru по машинному обучению

В субботу завершился месячный конкурс по машинному обучению от mail.ru ML bootcamp 5. я занял в нем 14ое место. Это уже третий мой конкурс, в котором я выиграл одежду и за время участия у меня сформировался фреймворк (который я, недолго думая, назвал QML, сокращение от ника и machine learning) для помощи в подборе решения в подобных соревнованиях. На примере решения ML bootcamp 5 я опишу как им пользоваться.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Разработка скриптов-обёрток с помощью инструмента Sparrow

В данном посте я хочу рассказать как с помощью инструмента Sparrow лёгко и просто писать собственные обёртки к существующим скриптам и утилитам, а так же зачем вам это может понадобиться.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Электронная демократия или как собрать и обработать данные по голосованию (и явке) за реновацию в Москве

Стоило голосованию за вход или выход из программы реновации завершиться — и с сайта мэра Москвы почему-то пропали данные о явке по каждому конкретному дому, остались только голоса за и против в целом. В новостях, конечно, пишут некие цифры, но ведь хочется посмотреть их самому, поиграться со статистикой, построить графики, не правда ли? 

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Создание своего первого Flask приложения

В статье подробно разобран процесс создания первого приложения на Flask и Python

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса

Сегодня в рамках школы начинается открытое соревнование, участники которого будут ни много ни мало искать нейтрино. Принять участие в поисках мы приглашаем всех желающих. Им предстоит обрабатывать данные с международного эксперимента OPERA. Для этого будут предоставлены исходные данные — результаты сканирования слоев фотопленок одного «кирпича» эксперимента OPERA. Соревнование состоит из двух этапов. На первом этапе участники будут искать отдельный ливень в «кирпиче», первая вершина которого известна, на втором — несколько ливней, рассредоточенных по объему «кирпича» без дополнительной информации. Победители смогут рассказать о своих решениях ученым, работающим в ЦЕРНе.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Чудесный мир Word Embeddings: какие они бывают и зачем нужны?

Начать стоит от печки, то есть с постановки задачи. Откуда берется сама задача word embedding?
Лирическое отступление: К сожалению, русскоязычное сообщество еще не выработало единого термина для этого понятия, поэтому мы будем использовать англоязычный.
Сам по себе embedding — это сопоставление произвольной сущности (например, узла в графе или кусочка картинки) некоторому вектору.