IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     07.12.2017       Выпуск 207 (04.12.2017 - 10.12.2017)       Статьи
     07.12.2017       Выпуск 207 (04.12.2017 - 10.12.2017)       Статьи
     06.12.2017       Выпуск 207 (04.12.2017 - 10.12.2017)       Статьи
     05.12.2017       Выпуск 207 (04.12.2017 - 10.12.2017)       Статьи

Tcl/Tk. Тематические виджеты TTK и дизайнер TKproE-2.20

Просматривая свои заметки по проектированию GUI с использованием виджетов Tk, я почувствовал какую-то неудовлетворенность. А дело оказалось в том, что я фактически упустил работу с тематическими виджетами ttk (themed tk). Они в скользь были задействованы при рассмотрении пакета Tkinter для Python и использовании дизайнера Page . Там речь шла о виджете TNotebook (блокнот, записная книжка) из пакета ttk. 

     05.12.2017       Выпуск 207 (04.12.2017 - 10.12.2017)       Статьи

Как я написал приложение, которое за 15 минут делало тоже самое, что и регулярное выражение за 5 дней

Не так давно столкнулся с проблемой поиска набора слов в большом тексте. Разумеется главной проблемой стала производительность. Поиск готовых решений порождал больше вопросов, чем давал ответов. Часто я натыкался на примеры использования каких-то сторонних коробок или онлайн-сервисов. А мне в первую очередь нужно было простое и легкое решение, которое в дальнейшем дало бы мысли для реализации собственной утилиты.

Несколько недель назад вышла замечательная англоязычная статься об open-source python-библиотеки FlashText. Эта библиотека предоставляла быстрое работающее решение задачи поиска и замены ключевых слов в тексте.

Т.к. на русском материалов подобной тематики не так много, то я решил перевести эту статью на русский. Под катом вас ждет описание проблемы, разбор принципа работы библиотеки а так же примеры тестов производительности.

     04.12.2017       Выпуск 207 (04.12.2017 - 10.12.2017)       Статьи
     04.12.2017       Выпуск 207 (04.12.2017 - 10.12.2017)       Статьи

Введение в обучение с подкреплением: от многорукого бандита до полноценного RL агента

Обучение с подкреплением является одним из самых перспективных направлений машинного обучения. С его помощью искусственный интеллект сегодня способен решать широчайший спектр задач: от робототехники и видеоигр до моделирования поведения покупателей и здравоохранения. В этой вводной статье мы изучим главную идею reinforcement learning и с нуля построим собственного самообучающегося бота.

     03.12.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи
     02.12.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи

Учим компьютер писать как Толстой, том I

 

Недавно на хабре наткнулся на эту статью https://habrahabr.ru/post/342738/. И захотелось написать про word embeddings, python, gensim и word2vec. В этой части я постараюсь рассказать о обучении базовой модели w2v.

     01.12.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи

Hik or Hack? (НЕ)безопасность Интернета вещей на примере IP-камеры Hikvision

В современном мире нас окружают «умные» устройства, в том или ином виде представляющие собой маленький компьютер. С точки зрения интеграции с современным оборудованием, будь то бытовая электроника и умные дома, медицинское и банковское оборудование, развлекательные системы и промышленное оборудование — все это представляет собой встраиваемые системы (embedded-устройства).

«Умные» гаджеты очень плотно влились в нашу жизнь, и их число из года в год растёт благодаря их низкой стоимости, удобству и простоте в использовании, в том числе через Интернет. Однако за рядом плюсов скрываются минусы, невидимые на первый взгляд рядовому пользователю. 

     30.11.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи
     30.11.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи
     30.11.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи

Переводим что угодно в вектор

Использование entity2vec

     30.11.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи
     30.11.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи

Биороботы нашего времени — избавляемся от рутины вместе с Telegram. Реальный кейс без фантазий

В интернетах не прекращается хайп вокруг чат-ботов — в частности Telegram — благодаря шуму в СМИ, неоспоримых достоинствах платформы, политике продвижения, средствам разработки и т.д.

Смотришь новости: ну жизни нет без чат-ботов! 
Да если их не будет — поезда с рельс сойдут, упадут самолеты, погибнут люди от тоски, когда не смогут найти картинки с котиками.

Но давайте положим руку на сердце: когда последний раз вы что-то заказывали в интернет магазине через чат-бот? 

     29.11.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи

Классификация звуков с помощью TensorFlow

Для распознавания человеческой речи придумано множество сервисов — достаточно вспомнить Pocketsphinx или Google Speech API. Они способны довольно качественно преобразовать в печатный текст фразы, записанные в виде звукового файла. Но ни одно из этих приложений не может сортировать разные звуки, захваченные микрофоном. Что именно было записано: человеческая речь, крики животных или музыка? Мы столкнулись с необходимостью ответить на этот вопрос. И решили создать пробные проекты для классификации звуков с помощью алгоритмов машинного обучения. В статье описано, какие инструменты мы выбрали, с какими проблемами столкнулись, как обучали модель для TensorFlow, и как запустить наше решение с открытым исходным кодом. Также мы можем загружать результаты распознавания на IoT-платформу DeviceHive, чтобы использовать их в облачных сервисах для сторонних приложений.

     27.11.2017       Выпуск 206 (27.11.2017 - 03.12.2017)       Статьи

Как научить нейросеть придумывать названия российских населенных пунктов

Всем привет, меня зовут Илья, я занимаюсь компьютационной биологией и биохимией, в свободное время я заставляю нейросети страдать ерундой.

Основываясь на аналогичных проектах (названия британских деревеньназвания мест в Орегоненазвания различных цветов и их RGB), я решил научить нейросеть создавать названия несуществующих населенных пунктов

В качестве нейросети я решил воспользоваться torch-rnn, которую достаточно легко установить и настроить. Список городов и сел я нашел тут (можно скачать все в формате csv). С csv пришлось немного повозиться, чтобы привести ее к utf-8, после чего я запихнул ее в нейросеть и оставил на пару часов. Когда тренировка модели закончилась я взял небольшой сампл и получил следующий результат: