IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python

     20.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи
     18.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи

Делаем домашнюю библиотеку с Notion и Python

Мне всегда было интересно, как бы получше распределить книги у себя в электронной библиотеке. В итоге пришел к такому варианту с автоматическим подсчетом количества страниц и прочими плюшками. Всех заинтересованных прошу под кат.

     18.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи

Анализируем историю прослушивания в «Яндекс.Музыке»

Вот уже почти год я пользуюсь сервисом Яндекс Музыка и меня все устраивает. Но есть в этом сервисе одна интересная страница — история. Она хранит все треки, которые были прослушаны, в хронологическом порядке. И мне, конечно, захотелось скачать ее и проанализировать, что я там наслушал за все время.

     18.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи

Must-have алгоритмы машинного обучения


Этот пост — краткий обзор общих алгоритмов машинного обучения. К каждому прилагается краткое описание, гайды и полезные ссылки.

     18.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи

Элементарная симуляция кастомного физического взаимодействия на python + matplotlib

Что будет в этой статье.

Общий случай:

 

  1. Опишем базу, а именно работу с векторами (велосипед для тех, у кого нет под рукой numpy)
  2. Опишем материальную точку и поле взаимодействия
Частный случай (на основе общего):

 

  1. Сделаем визуализацию векторного поля напряженности электромагнитного поля (первая и третья картинки)
  2. Сделаем визуализацию движения частиц в электромагнитном поле

     18.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи
     17.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи

Как оптимизировать pandas при работе с большими datasetами (очерк)

Когда памяти вагоны и/или dataset небольшой можно смело закидывать его в pandas безо всяких оптимизаций. Однако, если данные большие, остро встает вопрос, как их обрабатывать или хотя бы считать.

Предлагается взглянуть на оптимизацию в миниатюре, дабы не вытаскивать из сети гигантские датасеты.

В качестве датасета будем использовать хабрастатистику с комментариями пользователей за 2019 г., которая является общедоступной благодаря одному трудолюбивому пользователю:
dataset

     17.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи

PyCrunch – Интеллектуальное выполнение тестов и визуальное покрытие кода в IDE

Около 3 лет назад я перешел с C# разработки на Python. Два с половиной года я пытался найти инструмент, который был бы похож на NCrunch по удобству в ежедневной работе.

В какой-то момент я забил забил на unit-тестирование, и писал код, прогоняя тесты на CI.

Но идея никак не уходила из головы. Хотелось создать инструмент, который бы значительно упрощал разработку с помощью тестов, при этом, рекомендовать его коллегам и друзьям.

Полгода разработки, и активное использование на собственных проектах, вызывает желание показать продукт сообществу.

     17.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи
     17.09.2019       Выпуск 300 (16.09.2019 - 22.09.2019)       Статьи
     15.09.2019       Выпуск 299 (09.09.2019 - 15.09.2019)       Статьи
     15.09.2019       Выпуск 299 (09.09.2019 - 15.09.2019)       Статьи
     14.09.2019       Выпуск 299 (09.09.2019 - 15.09.2019)       Статьи
     13.09.2019       Выпуск 299 (09.09.2019 - 15.09.2019)       Статьи

Робот-тележка на ROS.Часть 4. Создаем симуляцию робота в rviz и gazebo

Продолжение цикла статей о создании небольшого робота. В этот раз речь пойдет о создании копии робота в симуляции, которую предлагают визуальные ROS-среды rviz и gazebo (далее «редакторы»). Работа в редакторах будет вестись на виртуальной машине, образ которой был ранее предоставлен для скачивания (образ). Так как речь идет о симуляции, построении модели, сам робот-тележка не понадобится.

     13.09.2019       Выпуск 299 (09.09.2019 - 15.09.2019)       Статьи
     11.09.2019       Выпуск 299 (09.09.2019 - 15.09.2019)       Статьи

Анализ эмоциональной окраски отзывов с Кинопоиска

Обработка естественного языка (NLP) является популярной и важной областью машинного обучения. В данном хабре я опишу свой первый проект, связанный с анализом эмоциональной окраски кино отзывов, написанный на Python. Задача сентиментного анализа является довольно распространенной среди тех, кто желает освоить базовые концепции NLP, и может стать аналогом 'Hello world' в этой области.

В этой статье мы пройдем все основные этапы процесса Data Science: от создания собственного датасета, его обработки и извлечения признаков с помощью библиотеки NLTK и наконец обучения и настройки модели с помощью scikit-learn. Сама задача состоит в классификации отзывов на три класса: негативные, нейтральные и позитивные.