IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     24.07.2017       Выпуск 188 (24.07.2017 - 30.07.2017)       Статьи

Рейтинг языков программирования 2017 от IEEE Spectrum

На прошлой неделе журнал IEEE Spectrum опубликовал интерактивный рейтинг языков программирования. Давайте узнаем, на каком месте Python.

     23.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Использование VK Streaming API с оповещением в Telegram

Вконтакте запустил Streaming API, инструмент для получения публичных данных из ВКонтакте по заданным ключевым словам. 

ВК сам присылает новый подходящий контент по мере его появления. Таким образом можно получать интересующие записи без вступление в десятки групп, сразу после публикации.

Давайте напишем бота для телеграмма с оповещением о записях в ВК.

     21.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Британские спутниковые снимки 2: Как все было на самом деле

Сразу оговорюсь, что данный пост не несет большой технической нагрузки и должен восприниматься исключительно в режиме «пятничной истории». Кроме того, текст насыщен английскими словами, какие-то из них я не знаю как перевести, а какие-то переводить просто не хочется.

     20.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Getsploit: поиск и загрузка эксплойтов по агрегированной базе данных

Когда я думал над дальнейшим вектором развития Vulners, я обратил внимание на наших старших братьев — базу данных Exploit-DB. Одной из основных утилит в их арсенале является searchsploit. Это консольная утилита, которая позволяет искать эксплойты по пользовательским поисковым запросам и сразу же получать их исходные коды. Она является базовой частью Kali Linux и оперирует данными по эксплойтам из базы Exploit-DB. Что самое "вкусное", что утилита умеет работать с локальной базой и ты можешь всегда взять ее с собой. Так чем же мы хуже? Мы собрали в Vulners не только коллекцию эксплойтов из Exploit-DB, но и Packet Storm, 0day.today, Seebug, Zero Science Lab и многих других. Что же, давайте изобретем новый велосипед с преферансом и поэтессами.

     19.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

«Функция getsizeof не такая» или «Информация устаревает»

Об изменении в getsizeof и коференции PyCon Russia 2017.

     19.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Учебные материалы

Книга «Python. Уроки»

Я являюсь одним из авторов блога devpractice.ru. В конце апреля 2017 года нами была написана завершающая статья из цикла «Уроки по языку Python», всего их получилось 15 штук. Спустя какое-то время, у нас появилась идея объединить весь накопленный материал. Так появилось первое издание книги «Python. Уроки». Эту книгу мы решили распространять бесплатно и предлагаем вам ознакомиться с ней.
Скачать «Python. Уроки» вы можете непосредственно с сайта. В книге основной акцент сделан на обучение базовым вещам (установка и запуск программ, типы данных, условные операторы и циклы, структуры данных, функции, исключения), темы, связанные с ООП, итераторами и генераторами даны в ознакомительном объеме.

     18.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Яндекс открывает технологию машинного обучения CatBoost

Яндекс выложил в open source собственную библиотеку CatBoost, разработанную с учетом многолетнего опыта компании в области машинного обучения. С ее помощью можно эффективно обучать модели на разнородных данных, в том числе таких, которые трудно представить в виде чисел (например, виды облаков или категории товаров). Исходный код, документация, бенчмарки и необходимые инструменты уже опубликованы на GitHub под лицензией Apache 2.0.

     18.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

QML: как легко получать футболки в конкурсах mail.ru по машинному обучению

В субботу завершился месячный конкурс по машинному обучению от mail.ru ML bootcamp 5. я занял в нем 14ое место. Это уже третий мой конкурс, в котором я выиграл одежду и за время участия у меня сформировался фреймворк (который я, недолго думая, назвал QML, сокращение от ника и machine learning) для помощи в подборе решения в подобных соревнованиях. На примере решения ML bootcamp 5 я опишу как им пользоваться.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Разработка скриптов-обёрток с помощью инструмента Sparrow

В данном посте я хочу рассказать как с помощью инструмента Sparrow лёгко и просто писать собственные обёртки к существующим скриптам и утилитам, а так же зачем вам это может понадобиться.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Электронная демократия или как собрать и обработать данные по голосованию (и явке) за реновацию в Москве

Стоило голосованию за вход или выход из программы реновации завершиться — и с сайта мэра Москвы почему-то пропали данные о явке по каждому конкретному дому, остались только голоса за и против в целом. В новостях, конечно, пишут некие цифры, но ведь хочется посмотреть их самому, поиграться со статистикой, построить графики, не правда ли? 

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Создание своего первого Flask приложения

В статье подробно разобран процесс создания первого приложения на Flask и Python

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Учебные материалы

Книга «Автостопом по Python»

Мы издали книгу, составленную на основе одноименного онлайнового руководства и содержащую наработки многочисленных профессионалов и энтузиастов, знающих, что такое Python и чего вы от него хотите.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса

Сегодня в рамках школы начинается открытое соревнование, участники которого будут ни много ни мало искать нейтрино. Принять участие в поисках мы приглашаем всех желающих. Им предстоит обрабатывать данные с международного эксперимента OPERA. Для этого будут предоставлены исходные данные — результаты сканирования слоев фотопленок одного «кирпича» эксперимента OPERA. Соревнование состоит из двух этапов. На первом этапе участники будут искать отдельный ливень в «кирпиче», первая вершина которого известна, на втором — несколько ливней, рассредоточенных по объему «кирпича» без дополнительной информации. Победители смогут рассказать о своих решениях ученым, работающим в ЦЕРНе.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Чудесный мир Word Embeddings: какие они бывают и зачем нужны?

Начать стоит от печки, то есть с постановки задачи. Откуда берется сама задача word embedding?
Лирическое отступление: К сожалению, русскоязычное сообщество еще не выработало единого термина для этого понятия, поэтому мы будем использовать англоязычный.
Сам по себе embedding — это сопоставление произвольной сущности (например, узла в графе или кусочка картинки) некоторому вектору.

     17.07.2017       Выпуск 187 (17.07.2017 - 23.07.2017)       Статьи

Использование нейронных сетей для распознавания рукописных цифр Часть 1

Человеческая визуальная система — одна из самых удивительных на свете. В каждом полушарии нашего мозга есть зрительная кора, содержащая 140 млн. нейронов с десятками млрд. связей между ними, но такая кора не одна, их несколько, и вместе они образуют настоящий суперкомпьютер в нашей голове, лучшим образом адаптированный в ходе эволюции под восприятие визуальной составляющей нашего мира. Но трудность распознавания визуальных образов становится очевидной, если вы попытаетесь написать программу для распознавания, скажем, рукописных цифр.

     15.07.2017       Выпуск 186 (10.07.2017 - 16.07.2017)       Статьи

Метод BFGS или один из самых эффективных методов оптимизации. Пример реализации на Python


Метод BFGS, итерационный метод численной оптимизации, назван в честь его исследователей: Broyden, Fletcher, Goldfarb, Shanno. Относится к классу так называемых квазиньютоновских методов. В отличие от ньютоновских методов в квазиньютоновских не вычисляется напрямую гессиан функции, т.е. нет необходимости находить частные производные второго порядка. Вместо этого гессиан вычисляется приближенно, исходя из сделанных до этого шагов.

     14.07.2017       Выпуск 186 (10.07.2017 - 16.07.2017)       Статьи

Вышел Upsource 2017.2 с поддержкой внешних инспекций кода, Python, NPM и многим другим

У нас отличные новости — вышел Upsource 2017.2! В этом релизе мы добавили ряд наиболее часто запрашиваемых возможностей, и, как обычно, улучшили уже имеющуюся функциональность.
Давайте посмотрим, что попало в этот релиз.

     14.07.2017       Выпуск 186 (10.07.2017 - 16.07.2017)       Статьи

Делаем сервис по распознаванию изображений с помощью TensorFlow Serving

 

Всегда наступает то самое время, когда обученную модель нужно выпускать в production. Для этого часто приходится писать велосипеды в виде оберток библиотек машинного обучения. Но если Ваша модель реализована на Tensorflow, то у меня для Вас хорошая новость — велосипед писать не придется, т.к. можно использовать Tensorflow Serving.