IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python

     12.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

Пять возможностей Python, которые вы должны знать!

Я перечислил пять возможностей Python, которые разработчики должны использовать для улучшения своего кода и экономии времени.

     12.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

DataScience Digest — 12.08.21

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning.

     12.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

Анализ аудио. Идентификация голоса

Реалии современного мир таковы, что аналитику всё чаще приходится прибегать к помощи новейших алгоритмов машинного обучения для выявления тех или иных отклонений в работе исследуемой системы. Наибольшей востребованностью пользуются алгоритмы компьютерного зрения для обработки фото и видео информации, а также техники работы с естественными языками для анализа текстов. Однако не стоит забывать о такой важной сфере, как работа с аудио, о которой и пойдет речь в этой статье.

     12.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

Парсинг Instagram в промышленных масштабах

В декабре 2020 года я завершил работать в научном институте и сразу же увлёкся задачей добычи данных из соцсетей, в частности из Инстаграма. Прежде я работал только с готовыми данными, поэтому мне всегда было интересно, как эти данные можно добывать. За несколько дней до Нового Года я написал достаточно базовую статью про то как парсить Инст. В первых числах января мне написал заказчик и попросил сделать для него масштабный парсер инстаграма, который был бы способен делать более 10.000 запросов в сутки.

     11.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

Автоботы, трансформируемся: как быстро и недорого победить 400 систем-десептиконов

Меня зовут Иван Маслов, я работаю в Страховом Доме ВСК на должности руководителя направления RPA. Расскажу Вам об опыте использования роботов, и о том как упростить работу с legacy системами. Уверен, будет интересно всем: и тем, кто скептически относится к роботам, и тем, кто хочет побольше о них узнать.

     11.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

Продолжаем ковырять Тинькофф API. Рассчитываем эффективность инвестиций

Данная статья является продолжением публикации, в которой я рассказывал о созданной мной программе, собирающей все доступные данные по брокерскому счёту клиента Тинькофф Инвестиций через API и формирующей большую Excel таблицу со всеми подробностями, которые вы не всегда найдёте в личном кабинете.

Цель проекта — повысить прозрачность при работе с инвестициями, чтобы держать все свои финансовые потоки под контролем, что должно сделать инвестирование более осознанным, а следовательно, более эффективным.

     11.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

Простые запросы SNMP в Python (с помощью pysnmp)

Этот пост предназначен в первую очередь для сотрудников телекома, админов и новичков в разработке, впервые столкнувшихся с необходимостью отправить snmp-запросы к какому-нибудь коммутатору и разобрать полученный ответ.

Разберем основы работы с библиотекой pysnmp на примере модуля, который принимает в качестве параметров oid-ы, ip и RO-community коммутатора и отдает человекопонятный json с ответами на эти oid-ы и ifAdminStatus, ifOperStatus, ifInOctets, ifOutOctets и ответ на запрос о типах линков

     10.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи
     10.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

КПД разработчика. Как успевать жить, работать и эволюционировать. Часть 1

Каждый из нас по-своему находит тот самый work-life balance. Или не находит. В серии статей мы спрашиваем разработчиков со впечатляющим бэкграундом, как они успевали и успевают жить, работать и эволюционировать.

     10.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

HuggingArtists | Генерируем текст песен с трансформером за 5 минут

В этой статье я расскажу о том, как создавался проект HuggingArtists и что у него под капотом. Мне будет очень приятно, если вы поставите сразу звезду в репозитории: Читать дальше →

     09.08.2021       Выпуск 399 (09.08.2021 - 15.08.2021)       Статьи

NER для русского языка в Spacy 3: удобно и легко

Славянские языки, в том числе и русский, считаются довольно сложными для обработки. В основном, из-за богатой системы окончаний, свободного порядка слов и других морфологических и синтаксических явлений. Распознавание именованных сущностей (далее, NER) представляется трудной задачей для славянских языков, где синтаксические зависимости часто маркируются морфологическими чертами, нежели определенным порядком словоформ. Поэтому NER сложен для этих языков в сравнении с германскими или романскими языками.

NER – популярная задача в сфере обработки естественного языка. Она заключается в распознавании именованных сущностей в тексте и определение их типов.

     08.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Автоматически генерируем стикеры для Телеграма из фото плакатов в интернет-магазине

В этой статье я расскажу, как я автоматически генерировал 42 стикера для Телеграма на основе изображений из интернет-магазина плакатов.

     07.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Асинхронность — в django

Да, эта статья о фреймворке для перфекционистов с дедлайнами и о том, как в нём не хватает асинхронности. По духу это больше похоже на Enhancement Proposal (менее формальный, чем он мог быть) или RFC, так что, если Вы любите подобные вещи, то Вам может быть интересно.

     05.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи
     05.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Ускоряем код на Питоне с помощью расширений на Cи

Питон — простой, но мощный язык, который заслуженно стал одним из самых популярных. Тем не менее, иногда ему не хватает скорости статически типизированных языков с предварительной компиляцией, таких как Cи и Джава.

     05.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Спектральный анализ временных рядов с помощью python

С развитием информационных технологий профессия DS стала чрезвычайно популярна. Сейчас почти каждый может имея ПК и установленный на нем стандартный пакет Python, анализировать данные и строить на их основе прогнозы.

Во многих случаях достаточно просто скачать библиотеку для анализа данных, и получить неплохие результаты. При этом процессы, происходящие внутри используемых пользователем библиотек, остаются за пределами понимания, что зачастую влечет за собой неспособности поверхностного пользователя правильно интерпретировать полученные данные, особенно если это нейросеть.

     04.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Разбираемся с ChainMap из коллекций Python

Работая с несколькими словарями, иногда нужно сгруппировать их и управлять ими как единым словарём. В других ситуациях у вас есть словари, представляющие различные области видимости, контексты и, чтобы получить данные в определённом порядке или с определённым приоритетом, нужно работать с ними как с единым словарём.

     04.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Ансамблевые методы машинного обучения

Ансамблевые методы - это мощный инструмент для построения моделей машинного обучения. Команды, которые используют их в соревнованиях на kaggle, занимают победные места. Ансамбли позволяют увеличить точность модели до 90+, при этом они довольно просты в понимании.

Поэтому я решил осветить эту тему в данной статье и показать реализацию ансамблей с помощью scikit-learn.

     03.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Полиномиальная регрессия и метрики качества модели

Давайте разберемся на примере. Скажем, я хочу спрогнозировать зарплату специалиста по данным на основе количества лет опыта. Итак, моя целевая переменная (Y) — это зарплата, а независимая переменная (X) — опыт. У меня есть случайные данные по X и Y, и мы будем использовать линейную регрессию для прогнозирования заработной платы. Давайте использовать pandas и scikit-learn для загрузки данных и создания линейной модели.

     03.08.2021       Выпуск 398 (02.08.2021 - 08.08.2021)       Статьи

Всё о работе с cookie в Python — класс http.cookies

Модуль http.cookies реализует парсер для cookie, по большей части совместимый с RFC 2109 — документом со стандартами работы с cookie и смежными вещами.