IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     10.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

КПД разработчика. Как успевать жить, работать и эволюционировать. Часть 1

Каждый из нас по-своему находит тот самый work-life balance. Или не находит. В серии статей мы спрашиваем разработчиков со впечатляющим бэкграундом, как они успевали и успевают жить, работать и эволюционировать.

     10.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

HuggingArtists | Генерируем текст песен с трансформером за 5 минут

В этой статье я расскажу о том, как создавался проект HuggingArtists и что у него под капотом. Мне будет очень приятно, если вы поставите сразу звезду в репозитории: Читать дальше →

     09.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

NER для русского языка в Spacy 3: удобно и легко

Славянские языки, в том числе и русский, считаются довольно сложными для обработки. В основном, из-за богатой системы окончаний, свободного порядка слов и других морфологических и синтаксических явлений. Распознавание именованных сущностей (далее, NER) представляется трудной задачей для славянских языков, где синтаксические зависимости часто маркируются морфологическими чертами, нежели определенным порядком словоформ. Поэтому NER сложен для этих языков в сравнении с германскими или романскими языками.

NER – популярная задача в сфере обработки естественного языка. Она заключается в распознавании именованных сущностей в тексте и определение их типов.

     08.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Автоматически генерируем стикеры для Телеграма из фото плакатов в интернет-магазине

В этой статье я расскажу, как я автоматически генерировал 42 стикера для Телеграма на основе изображений из интернет-магазина плакатов.

     07.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Асинхронность — в django

Да, эта статья о фреймворке для перфекционистов с дедлайнами и о том, как в нём не хватает асинхронности. По духу это больше похоже на Enhancement Proposal (менее формальный, чем он мог быть) или RFC, так что, если Вы любите подобные вещи, то Вам может быть интересно.

     05.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи
     05.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Ускоряем код на Питоне с помощью расширений на Cи

Питон — простой, но мощный язык, который заслуженно стал одним из самых популярных. Тем не менее, иногда ему не хватает скорости статически типизированных языков с предварительной компиляцией, таких как Cи и Джава.

     05.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Спектральный анализ временных рядов с помощью python

С развитием информационных технологий профессия DS стала чрезвычайно популярна. Сейчас почти каждый может имея ПК и установленный на нем стандартный пакет Python, анализировать данные и строить на их основе прогнозы.

Во многих случаях достаточно просто скачать библиотеку для анализа данных, и получить неплохие результаты. При этом процессы, происходящие внутри используемых пользователем библиотек, остаются за пределами понимания, что зачастую влечет за собой неспособности поверхностного пользователя правильно интерпретировать полученные данные, особенно если это нейросеть.

     04.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Разбираемся с ChainMap из коллекций Python

Работая с несколькими словарями, иногда нужно сгруппировать их и управлять ими как единым словарём. В других ситуациях у вас есть словари, представляющие различные области видимости, контексты и, чтобы получить данные в определённом порядке или с определённым приоритетом, нужно работать с ними как с единым словарём.

     04.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Ансамблевые методы машинного обучения

Ансамблевые методы - это мощный инструмент для построения моделей машинного обучения. Команды, которые используют их в соревнованиях на kaggle, занимают победные места. Ансамбли позволяют увеличить точность модели до 90+, при этом они довольно просты в понимании.

Поэтому я решил осветить эту тему в данной статье и показать реализацию ансамблей с помощью scikit-learn.

     03.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Полиномиальная регрессия и метрики качества модели

Давайте разберемся на примере. Скажем, я хочу спрогнозировать зарплату специалиста по данным на основе количества лет опыта. Итак, моя целевая переменная (Y) — это зарплата, а независимая переменная (X) — опыт. У меня есть случайные данные по X и Y, и мы будем использовать линейную регрессию для прогнозирования заработной платы. Давайте использовать pandas и scikit-learn для загрузки данных и создания линейной модели.

     03.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Всё о работе с cookie в Python — класс http.cookies

Модуль http.cookies реализует парсер для cookie, по большей части совместимый с RFC 2109 — документом со стандартами работы с cookie и смежными вещами.

     03.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

BDD-тестирование чат-бота

Многие знакомы с методологией Test-Driven Development и, в частности, Behavior-Driven Development. Этот подход к разработке и обеспечению качества ПО набрал большую популярность, поскольку позволяет выстроить четко установленное соответствие между бизнес-требованиями и технической реализацией продукта.

     03.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Marshmallow vs. Pydantic: две лучшие библиотеки для сериализации и валидации данных на Python

Сериализация и десериализация данных — это преобразование между необработанной структурой данных и экземплярами классов для их хранения и передачи. Например, преобразование объектов Python в JSON-представление. Мы рассмотрим две популярные Python-библиотеки Marshmallow и Pydantic, которые помогут нам справиться как с преобразованием, так и с валидацией данных. Сначала я представлю вам каждую библиотеку, используя небольшие примеры, а потом мы сравним их и разберем различия. Я также расскажу, чего вам стоит избегать при работе с обеими библиотеками.

     02.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Нейродайджест: главное из области машинного обучения за июль 2021

Новый язык программирования от Open AI, рост популярности диффузионных моделей, чат-бот с памятью не как у золотой рыбки — об этом и многом другом в июльском выпуске.

     02.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Профессионально обрабатываем исключения в Python

Одним из недостатков гибких языков, таких как Python, является предположение, что если что-то работает, то скорее всего оно сделано правильно. Я хочу написать скромное руководство по эффективному использованию исключений в Python, правильной их обработке и логировании.

 

     02.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Кратко: запросы к API и разбор XML-ответов. Python

Этот пост предназначен в первую очередь для новичков в разработке, впервые столкнувшихся с необходимостью отправить post/get запросы к какому-нибудь API и проанализировать полученный в XML ответ. Постаралась собрать необходимы минимум в одном месте.

     30.07.2021       Выпуск 397 (26.07.2021 - 01.08.2021)       Статьи

Как перенести нейросеть на мобильное устройство

В статье поговорим как обучить несложную CNN сеть с помощью tensorflow, конвертировать готовое с помощью tensoflow-lite и перенести на мобильное устройство под управлением android.
Описывается личный опыт автора, поэтому нет претензий на всеохватывающее руководство.

     30.07.2021       Выпуск 397 (26.07.2021 - 01.08.2021)       Статьи

13 проектов для Python-программистов уровня intermediate

Изучение основ Python — прекрасный опыт. Но эйфория от изучения языка постепенно заменяется желанием создать что-то своими руками. И это нормально, но нужны идеи.

Проблема здесь в том, что некоторые проекты либо слишком просты, либо слишком сложны для разработчика среднего уровня. Эта статья — помощь программисту уровня intermediate. Она предоставляет несколько идей проектов, которые могут стать интересным вызовом для вас.

     29.07.2021       Выпуск 397 (26.07.2021 - 01.08.2021)       Статьи

Микросервисы vs. Монолит

В начале ноября на ютуб-канале Яндекс.Практикума прошли дебаты «Микросервисы, Монолит и Зомби». Ведущие дебатов — наставник курса «Мидл Python-разработчик» Руслан Юлдашев и техлид курса Савва Демиденко — разобрали архитектуры двух систем, прошлись по реальным задачам и ошибкам из своей рабочей практики и по очереди защищали свои позиции.