IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python

     26.03.2018       Выпуск 223 (26.03.2018 - 01.04.2018)       Статьи

Обзор второго дня Data Science Weekend 2018. Data Engineering, ETL, поисковые сервисы и многое другое

Несколько дней назад мы публиковали обзор первого дня Data Science Weekend 2018, который прошел 2-3 марта на Мансарде Rambler&Co. Изучив практику использования алгоритмов машинного обучения, теперь перейдем к обзору второго дня конференции, в течении которого спикеры рассказывали об использовании различных инструментов дата инженера для нужд дата-платформ, ETL, сервисах подсказок при поиске и многом другом.

     26.03.2018       Выпуск 223 (26.03.2018 - 01.04.2018)       Статьи

Состоялся релиз Krita 4.0, свободного графического редактора для художников

Новый релиз Krita принес кучу изменений. Традиционно, при изменении мажорной версии много где сломали обратную совместимость и разработчики предупреждают о необходимости бэкапов при пересохранении в новом формате. Особенно сильно была переработана работа с векторными сущностями и текстом. Разработчики признались, что у них не хватило сил тянуть отдельную реализацию встроенного текста в виде ODT, поэтому все перевели на распространенный SVG. Для оптимальной совместимости они напоминают о возможности установки двух веток одновременно. В Windows все реализовано достаточно привычно, а для Linux есть snap пакеты и другие варианты stand-alone установки.

     24.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

«Cделать красиво». Визуализация обучения с Tensorboard от Google

Красота, как известно, требует жертв, но и мир обещает спасти. Достаточно свежий (2015г) визуализатор от Google призван помочь разобраться с процессами, происходящими в сетях глубокого обучения. Звучит заманчиво.

Красочный интерфейс и громкие обещания затянули на разбор этого дизайнерского шайтана, с неинтуитивно отлаживающимися глюками. API непривычно скудный и часто обновляющийся, примеры в сети однотипны (глаза уже не могут смотреть на заезженный MNIST).

     23.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Хеш-стеганография в dataset-ах. На этот раз быстрая

В своём прошлом посте про хеш-стеганографию я предложил иной подход в стеганографии — не вкраплять никакой информации в контейнер, а просто упорядочивать контейнеры в нужном порядке и тем самым передавать скрытую информацию. Два дня назад romabibi опубликовал proof of consept для хеш-стеганографии в соц.сети вКонтакте.

     23.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи
     22.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи
     22.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Как использовать HDF5 файлы в Python

Сохраняем большие объемы данных, а потом читаем.

     22.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи
     22.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Автоматическая векторизация спутниковых снимков: одна модель — два первых места

В данной статье хочу поделиться с вами историей о том, как одна и та же архитектура модели принесла сразу две победы в соревнованиях по машинному обучению на платформе topcoder с интервалом месяц.

     22.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Бинарный формат PSON

PSON (Pandora Simple Object Notation) – бинарный формат упаковки, позволяющий переводить простые типы данных, массивы и списки в последовательность байт (простую строку). PSON придуман и разработан для использования в свободной распределённой информационной системе Pandora как более простая альтернатива бинарному формату BSON.

     22.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Движок поиска по нескольким моделям в Django Django

О том как использовать Manager для поиска по нескольким моделям

     21.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Авторизация через Telegram в Django и Python Telegram Django

В начале февраля Павел Дуров анонсировал, что у Telegram появился так называемый Telegram Login Widget. Проще говоря, теперь любой желающий может встроить авторизацию на своем сайте через Telegram, наряду с уже удобными способами входа через привычные для всех Google, Twitter, Facebook и так далее.

В этой заметке я хочу рассказать и наглядно показать как это сделать, используя Django. Исходный код свободно доступен в моем репозитории на GitHub. Пользуйтесь на здоровье.

     21.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Хэш-стеганография с использованием vkapi

Некоторое время назад решил разобраться, что такое стеганография, в чем её смысл и какая она бывает. И спустя несколько ссылок наткнулся на интересную статью про хэш-стеганографию. Возник вопрос — а почему бы не попробовать реализовать такой способ передачи на практике? Для начала — в виде proof of concept.

     21.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи
     20.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Hessian-Free оптимизация с помощью TensorFlow

Я хочу рассказать про метод оптимизации известный под названием Hessian-Free или Truncated Newton (Усеченный Метод Ньютона) и про его реализацию с помощью библиотеки глубокого обучения — TensorFlow. Он использует преимущества методов оптимизации второго порядка и при этом нет необходимости считать матрицу вторых производных. В данной статье описан сам алгоритм HF, а так же представлена его работа для обучения сети прямого распространения на MNIST и XOR датасетах.

     20.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Военное ведомство США должно срочно переосмыслить стратегию в области машинного обучения

Недавно стало известно, что Google (корпорация добра) занимается анализом видеоизображений с военных дронов. Этот проект называется Project Maven и был предложен в апреле 2017 года. Что интересно, сотрудничество с Google в этом проекте организовывал сам Эрик Шмидт, бывший председатель совета директоров Alphabet, и нынешний председатель Совета по оборонным инновациям DIB.

     20.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Несколько советов по организации Python-приложения на сервере

В этой статье я хочу поделиться несколькими удобными способами организации вашего проекта на рабочем (даже продакшен) сервере.

 

 

Я работаю, в основном, с Python/Django стеком, поэтому все примеры будут, в первую очередь, применительно к этому набору. Также ключевые технологии: Ubuntu (17.10), Python3 (3.6).

     19.03.2018       Выпуск 222 (19.03.2018 - 25.03.2018)       Статьи

Классификация музыкальных композиций по исполнителям с помощью Скрытых Марковских Моделей

Скрытые марковские модели (Hidden Markov Models) с давних времен используются в распознавании речи. Благодаря мел-кепстральным коэффициентам (MFCC), появилась возможность откинуть несущественные для распознавания компоненты сигнала, значительно снижая размерность признаков. В интернете много простых примеров использования HMM с MFCC для распознавания простых слов.

После знакомства с этими возможностями появилось желание опробовать этот алгоритм распознавания в музыке. Так родилась идея задачи классификации музыкальных композиций по исполнителям. О попытках, какой-то магии и результатах будет рассказано в этом посте.