IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     26.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи

Python.org рекомендует: Программирование для НЕпрограммистов

Предлагаем вашему вниманию подборку материалов от python.org о том, с чего начать первые шаги в программировании. Если Вы никогда не занимались программированием раньше, эти материалы для вас. Данные туториалы не предполагают, что у вас есть какой-то опыт. (Если у вас уже есть опыт программирования, посетите Beginners Guide).

     26.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи

Оптимизация запросов Django ORM

Оригинальная статья: Rocio Aramberri – Optimizing Django ORM Queries

Django ORM (Object Relational Mapping) – одна из самых мощных функций Django. Благодаря ей мы можем взаимодействовать с базой данных, используя код Python вместо SQL.

     26.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи
     26.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи
     25.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи
     25.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи

6 способов значительно ускорить pandas с помощью пары строк кода. Часть 1

В этой статье я расскажу о шести инструментах, способных значительно ускорить ваш pandas код. Инструменты я собрал по одному принципу — простота интеграции в существующую кодовую базу. Для большинства инструментов вам достаточно установить модуль и добавить пару строк кода.

     25.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи

Шпаргалка по визуализации данных в Python с помощью Plotly

В этой простыне все примеры разобраны от совсем простых к более сложным, так что разработчикам с опытом будет скучно. Так же эта «шпаргалка» не заменит на 100% примеры из документации.

     25.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи
     25.05.2020       Выпуск 336 (25.05.2020 - 31.05.2020)       Статьи
     24.05.2020       Выпуск 335 (18.05.2020 - 24.05.2020)       Статьи
     24.05.2020       Выпуск 335 (18.05.2020 - 24.05.2020)       Статьи
     24.05.2020       Выпуск 335 (18.05.2020 - 24.05.2020)       Статьи
     23.05.2020       Выпуск 335 (18.05.2020 - 24.05.2020)       Статьи

Лемматизируй это быстрее (PyMorphy2, PyMystem3 и немного магии)

При обработке естественного языка требуется предварительная подготовка документов, и одним из способов является лемматизация – приведение всех слов текста к их нормальным формам с учетом контекста.

Недавно мы столкнулись с проблемой больших временных затрат на этот процесс. В конкретной задаче было более 100000 документов, средняя длина которых около 1000 символов, и требовалось реализовать обработку на обычном локальном компьютере, а не на нашем сервере для вычислений. Решение на просторах интернета мы найти не смогли, но нашли его сами, и я хотел бы поделиться — продемонстрировать сравнительный анализ двух наиболее популярных библиотек по лемматизации в этой статье.

     22.05.2020       Выпуск 335 (18.05.2020 - 24.05.2020)       Статьи

Как сделать тематическое моделирование форума быстро или что беспокоит людей с целиакией

В данной статье я расскажу и покажу на примере, о том, как человек с минимальным Data Science опытом, смог собрать данные из форума и сделать тематическое моделирование постов с использованием LDA модели, и выявил наболевшие темы людей с глютеновой непереносимостью.