IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     20.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Getsploit: поиск и загрузка эксплойтов по агрегированной базе данных

Когда я думал над дальнейшим вектором развития Vulners, я обратил внимание на наших старших братьев — базу данных Exploit-DB. Одной из основных утилит в их арсенале является searchsploit. Это консольная утилита, которая позволяет искать эксплойты по пользовательским поисковым запросам и сразу же получать их исходные коды. Она является базовой частью Kali Linux и оперирует данными по эксплойтам из базы Exploit-DB. Что самое "вкусное", что утилита умеет работать с локальной базой и ты можешь всегда взять ее с собой. Так чем же мы хуже? Мы собрали в Vulners не только коллекцию эксплойтов из Exploit-DB, но и Packet Storm, 0day.today, Seebug, Zero Science Lab и многих других. Что же, давайте изобретем новый велосипед с преферансом и поэтессами.

     20.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Создаем widget для Jupyter notebook

Туториал про создание виджета для Jupyter

     20.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Parsing с Python: утилиты и библиотеки

Большой список утилит для упрощения парсинга на Python

     19.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

«Функция getsizeof не такая» или «Информация устаревает»

Об изменении в getsizeof и коференции PyCon Russia 2017.

     18.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи
     18.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи
     18.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Яндекс открывает технологию машинного обучения CatBoost

Яндекс выложил в open source собственную библиотеку CatBoost, разработанную с учетом многолетнего опыта компании в области машинного обучения. С ее помощью можно эффективно обучать модели на разнородных данных, в том числе таких, которые трудно представить в виде чисел (например, виды облаков или категории товаров). Исходный код, документация, бенчмарки и необходимые инструменты уже опубликованы на GitHub под лицензией Apache 2.0.

     18.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

QML: как легко получать футболки в конкурсах mail.ru по машинному обучению

В субботу завершился месячный конкурс по машинному обучению от mail.ru ML bootcamp 5. я занял в нем 14ое место. Это уже третий мой конкурс, в котором я выиграл одежду и за время участия у меня сформировался фреймворк (который я, недолго думая, назвал QML, сокращение от ника и machine learning) для помощи в подборе решения в подобных соревнованиях. На примере решения ML bootcamp 5 я опишу как им пользоваться.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Разработка скриптов-обёрток с помощью инструмента Sparrow

В данном посте я хочу рассказать как с помощью инструмента Sparrow лёгко и просто писать собственные обёртки к существующим скриптам и утилитам, а так же зачем вам это может понадобиться.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Электронная демократия или как собрать и обработать данные по голосованию (и явке) за реновацию в Москве

Стоило голосованию за вход или выход из программы реновации завершиться — и с сайта мэра Москвы почему-то пропали данные о явке по каждому конкретному дому, остались только голоса за и против в целом. В новостях, конечно, пишут некие цифры, но ведь хочется посмотреть их самому, поиграться со статистикой, построить графики, не правда ли? 

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Создание своего первого Flask приложения

В статье подробно разобран процесс создания первого приложения на Flask и Python

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса

Сегодня в рамках школы начинается открытое соревнование, участники которого будут ни много ни мало искать нейтрино. Принять участие в поисках мы приглашаем всех желающих. Им предстоит обрабатывать данные с международного эксперимента OPERA. Для этого будут предоставлены исходные данные — результаты сканирования слоев фотопленок одного «кирпича» эксперимента OPERA. Соревнование состоит из двух этапов. На первом этапе участники будут искать отдельный ливень в «кирпиче», первая вершина которого известна, на втором — несколько ливней, рассредоточенных по объему «кирпича» без дополнительной информации. Победители смогут рассказать о своих решениях ученым, работающим в ЦЕРНе.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Чудесный мир Word Embeddings: какие они бывают и зачем нужны?

Начать стоит от печки, то есть с постановки задачи. Откуда берется сама задача word embedding?
Лирическое отступление: К сожалению, русскоязычное сообщество еще не выработало единого термина для этого понятия, поэтому мы будем использовать англоязычный.
Сам по себе embedding — это сопоставление произвольной сущности (например, узла в графе или кусочка картинки) некоторому вектору.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Использование нейронных сетей для распознавания рукописных цифр Часть 1

Человеческая визуальная система — одна из самых удивительных на свете. В каждом полушарии нашего мозга есть зрительная кора, содержащая 140 млн. нейронов с десятками млрд. связей между ними, но такая кора не одна, их несколько, и вместе они образуют настоящий суперкомпьютер в нашей голове, лучшим образом адаптированный в ходе эволюции под восприятие визуальной составляющей нашего мира. Но трудность распознавания визуальных образов становится очевидной, если вы попытаетесь написать программу для распознавания, скажем, рукописных цифр.

     15.07.2017       Выпуск 186 (10.07.2017 - 16.07.2017)       Статьи

Метод BFGS или один из самых эффективных методов оптимизации. Пример реализации на Python


Метод BFGS, итерационный метод численной оптимизации, назван в честь его исследователей: Broyden, Fletcher, Goldfarb, Shanno. Относится к классу так называемых квазиньютоновских методов. В отличие от ньютоновских методов в квазиньютоновских не вычисляется напрямую гессиан функции, т.е. нет необходимости находить частные производные второго порядка. Вместо этого гессиан вычисляется приближенно, исходя из сделанных до этого шагов.