IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     07.04.2020       Выпуск 329 (06.04.2020 - 12.04.2020)       Статьи

LDA на статьях LiveJournal + визуализация

Как-то раз стало интересно, какие темы выделит LDA (латентное размещение Дирихле) на материалах «Живого Журнала». Как говорится, есть интерес — нет проблем.

Для начала немного про LDA на пальцах, вдаваться в математические подробности не будем (кому интересно — почитает). Итак, LDA — является одним из наиболее распространенных алгоритмов для моделирования тем. Каждый документ (будь то статья, книга или любой другой источник текстовых данных) представляет собой смесь тем, а каждая тема представляет собой смесь слов.

     07.04.2020       Выпуск 329 (06.04.2020 - 12.04.2020)       Статьи

Начало работы с middleware в Django

Оригинальная статья: PAWEŁ FERTYKGetting started with Django middleware

Django поставляется с множеством полезных функций. Одним из них является механизм middleware (переводится как промежуточное программное обеспечение). В этом посте я кратко объясню, как работает middleware и как начать писать свой собственный.

Исходный код, включенный в этот пост, доступен на GitHub.

     07.04.2020       Выпуск 329 (06.04.2020 - 12.04.2020)       Статьи

Применение библиотеки FuzzyWuzzy для нечёткого сравнения в Python. Расстояние Левенштейна (редакционное расстояние)

Работая над голосовым помощником, который упоминается в предыдущей статье, понял, что просто не могу с вами не поделиться прекраснейшей библиотекой FuzzyWuzzy.

Если коротко, то благодаря ей существует возможность произвести нечёткое сравнение строк без каких-либо страданий.

     06.04.2020       Выпуск 329 (06.04.2020 - 12.04.2020)       Статьи

Прогнозирование временных рядов с помощью рекуррентных нейронных сетей

Итак, вашему вниманию представляется перевод страницы Time series forecasting из раздела руководств tensorflow: ссылка. Мои дополнения вместе с иллюстрациями к переводу нацелены помочь с пониманием основных идей в одном из самых интересных направлений ML и эконометрики в целом – прогнозировании временных рядов.

     06.04.2020       Выпуск 329 (06.04.2020 - 12.04.2020)       Статьи

9 лучших опенсорс находок за март 2020

Подготовил для вас подборку самых интересных находок из опенсорса за март 2020.

     05.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Как на Python подобрать экипировку для игрового перса

Учимся находить лучшее для своего разбойника при помощи программирования. Также разбираемся, не водит ли нас программа «за нос».

     04.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

ETL процесс получения данных из электронной почты в Apache Airflow

Как бы сильно не развивались технологии, за развитием всегда тянется вереница устаревших подходов. Это может быть обусловлено плавным переходом, человеческим фактором, технологическими необходимостями или чем-то другим. В области обработки данных наиболее показательными в этой части являются источники данных. Как бы мы не мечтали от этого избавиться, но пока часть данных пересылается в мессенджерах и электронных письмах, не говоря и про более архаичные форматы. Приглашаю под кат разобрать один из вариантов для Apache Airflow, иллюстрирующий, как можно забирать данные из электронных писем.

     04.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Создание Python-обвязки для библиотек, написанных на C/C++, с помощью SIP. Часть 2

В первой части статьи мы рассмотрели основы работы с утилитой SIP, предназначенной для создания Python-обвязок (Python bindings) для библиотек, написанных на языках C и C++. Мы рассмотрели основные файлы, которые нужно создать для работы с SIP и начали рассматривать директивы и аннотации. До сих пор мы делали обвязку для простой библиотеки, написанной на языке C. В этой части мы разберемся, как делать обвязку для библиотеки на языке C++, которая содержит классы. На примере этой библиотеки мы посмотрим, какие приемы могут быть полезны при работе с объектно-ориентированной библиотекой, а заодно разберемся с новыми для нас директивами и аннотациями.

     04.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Перспективны ли просевшие акции? Проанализируем с помощью python

Недавно прочитал статью о том, что акции-аутсайдеры (те, что максимально упали в цене за месяц) индекса Мосбиржи имеют бОльшие перспективы роста, нежели в среднем по индексу.

     03.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Самоходная платформа на МК esp8266 с micropyhon

Эта статья описывает страдания начинающего процесс изготовления самоходной платформы на базе МК esp8266 с micropython, управляемой через встроенный веб-сервер.

     03.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Создание Python-обвязки для библиотек, написанных на C/C++, с помощью SIP. Часть 1

Иногда во время работы над проектом на языке Python возникает желание использовать библиотеку, которая написана не на Python, а, например, на C или C++.

     03.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Макросы для питониста. Доклад Яндекса

Как можно расширить синтаксис Python и добавить в него необходимые возможности? Прошлым летом на PyCon я постарался разобрать эту тему. Из доклада можно узнать, как устроены библиотеки pytest, macropy, patterns и как они добиваются таких интересных результатов. В конце есть пример кодогенерации с помощью макросов в HyLang — Lisp-образного языка, бегущего поверх Python.

     03.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Как я сгенерировал на Python тысячу лиц для своей игры

На определённом этапе разработки своей игры я осознал, что мне нужна система диалогов с лицами-аватарами. Поэтому я решил создать генератор лиц на основе знаменитой игры Papers, Please.

     03.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Сортировки кучей: n-нарные пирамиды

Сортировку кучей (она же — пирамидальная сортировка) на Хабре уже поминали добрым словом не раз и не два, но это всегда была достаточно общеизвестная информация. Обычную бинарную кучу знают все, но ведь в теории алгоритмов также есть:

n-нарная куча; куча куч, основанная на числах Леонардо; дерамида (гибрид кучи и двоичного дерева поиска); турнирная мини-куча; зеркальная (обратная) куча; слабая куча; юнгова куча; биномиальная куча; и бог весть ещё какие кучи…

     02.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Машинное обучение без учителя. Отрывок из книги

Пока наши новинки печатаются в типографии, а офис сидит на удаленке, мы решили поделиться отрывком из книги Пола и Харви Дейтелов «Python: Искусственный интеллект, большие данные и облачные вычисления»

     01.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Альтернативная форма тернарного оператора Python

Недавно я открыл для себя альтернативу стандартной конструкции "expression_on_true if predicate else expression_on_false", которую я не встречал в справочниках:

     01.04.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи
     31.03.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Простой Telegram-бот на Flask с информированием о погоде

В этой статье я расскажу как сделать простейшего телеграмм бота на Python для отправки текущей погоды в Москве.

 

     31.03.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Используй время правильно: автоматизация процессов в Tinder

Думаю многие любят знакомиться в соц. сетях и пользуются приложениями (например Tinder), но часто уходит много времени на то, что бы ставить лайки и отправлять первые сообщения. Я считаю что это монотонные действия которые только отталкивают от
общения и знакомства. Если ты программист, зачем быть как все, давай вместе со мной автоматизируем процесс монотонных действий и оставим свое внимание только для приятного общения, но обо всём по порядку.

     31.03.2020       Выпуск 328 (30.03.2020 - 05.04.2020)       Статьи

Моя шпаргалка по pandas

Один преподаватель как-то сказал мне, что если поискать аналог программиста в мире книг, то окажется, что программисты похожи не на учебники, а на оглавления учебников: они не помнят всего, но знают, как быстро найти то, что им нужно.

Возможность быстро находить описания функций позволяет программистам продуктивно работать, не теряя состояния потока. Поэтому я и создал представленную здесь шпаргалку по pandas и включил в неё то, чем пользуюсь каждый день, создавая веб-приложения и модели машинного обучения.