Выпуск 399

(09.08.2021 - 15.08.2021)

pythondigest.ru: Выпуск 399

Статьи

      HuggingArtists | Генерируем текст песен с трансформером за 5 минут

В этой статье я расскажу о том, как создавался проект HuggingArtists и что у него под капотом. Мне будет очень приятно, если вы поставите сразу звезду в репозитории: Читать дальше →

      Поиск адресов в «испорченных» данных

Для проведения проверки мне необходимо было установить адреса нескольких сотен объектов недвижимости. Проблема в том, что адреса были написаны в разных частях документов, документы имели различные форматы, и сам адрес также мог быть написан разнообразными способами.

      Автоботы, трансформируемся: как быстро и недорого победить 400 систем-десептиконов

Меня зовут Иван Маслов, я работаю в Страховом Доме ВСК на должности руководителя направления RPA. Расскажу Вам об опыте использования роботов, и о том как упростить работу с legacy системами. Уверен, будет интересно всем: и тем, кто скептически относится к роботам, и тем, кто хочет побольше о них узнать.

      КПД разработчика. Как успевать жить, работать и эволюционировать. Часть 1

Каждый из нас по-своему находит тот самый work-life balance. Или не находит. В серии статей мы спрашиваем разработчиков со впечатляющим бэкграундом, как они успевали и успевают жить, работать и эволюционировать.

      NER для русского языка в Spacy 3: удобно и легко

Славянские языки, в том числе и русский, считаются довольно сложными для обработки. В основном, из-за богатой системы окончаний, свободного порядка слов и других морфологических и синтаксических явлений. Распознавание именованных сущностей (далее, NER) представляется трудной задачей для славянских языков, где синтаксические зависимости часто маркируются морфологическими чертами, нежели определенным порядком словоформ. Поэтому NER сложен для этих языков в сравнении с германскими или романскими языками.

NER – популярная задача в сфере обработки естественного языка. Она заключается в распознавании именованных сущностей в тексте и определение их типов.

      Владивосток, оползни и логистическая регрессия

27-28 августа 2019 года во Владивостоке и Приморском крае произошли массовые оползни. К счастью, обошлось без жертв. Однако, материальные потери оказались существенными: разбитые автомобили, перекрытые дороги, поврежденные здания и детские площадки. Оползни сошли в момент прохождения мощного циклона с обильными дождями. Мы робко предположили что "осадки виновны", распаковали методы классической статистики и приступили к исследованию.

      Cross-Fold Generation или как генерировать длинные последовательности с ruGPT-3

RuGPT-3 - AI-модель для русского языка, которая умеет писать тексты. Она может генерировать истории, стихи и новости, которые люди не могут отличить от настоящих. Похожая модель лежит в основе Балаболы от Яндекса. В этой статье мы описываем способ генерации длинных текстов без потери смысла на примере модели ruGPT-3 Large. Мы назвали этот метод Cross-Fold Generation. С ним можно генерировать последовательности более 2000 токенов с сохранением идеи текста.

      Заглянем в будущее Python

Мы пообщались с двумя людьми, от которых непосредственно зависит будущее Python. На наши вопросы ответили Core-developer community on Google Cloud Дастин Инграм и Director at Python Software Foundation Кэрол Виллинг. Их ответы о том, чего не хватает языку и как он будет развиваться дальше, вы узнаете, заглянув под кат.

      3D моделирование в Python

Допустим, вам потребовалось на языке программирования python, построить трёхмерную модель некоторого объекта, затем визуализировать его, или подготовить файл для печати на 3D принтере. Существует несколько библиотек, помогающих в решении этих задач. Поговорим о том, как строить трёхмерные модели из точек, граней и примитивов в python. Как выполнять элементарные приемы 3D моделирования: перемещение, поворот, объединение, вычитание и другие.

      Парсинг Instagram в промышленных масштабах

В декабре 2020 года я завершил работать в научном институте и сразу же увлёкся задачей добычи данных из соцсетей, в частности из Инстаграма. Прежде я работал только с готовыми данными, поэтому мне всегда было интересно, как эти данные можно добывать. За несколько дней до Нового Года я написал достаточно базовую статью про то как парсить Инст. В первых числах января мне написал заказчик и попросил сделать для него масштабный парсер инстаграма, который был бы способен делать более 10.000 запросов в сутки.

      Пять возможностей Python, которые вы должны знать!

Я перечислил пять возможностей Python, которые разработчики должны использовать для улучшения своего кода и экономии времени.

      Анализ аудио. Идентификация голоса

Реалии современного мир таковы, что аналитику всё чаще приходится прибегать к помощи новейших алгоритмов машинного обучения для выявления тех или иных отклонений в работе исследуемой системы. Наибольшей востребованностью пользуются алгоритмы компьютерного зрения для обработки фото и видео информации, а также техники работы с естественными языками для анализа текстов. Однако не стоит забывать о такой важной сфере, как работа с аудио, о которой и пойдет речь в этой статье.

      DataScience Digest — 12.08.21

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning.

      Продолжаем ковырять Тинькофф API. Рассчитываем эффективность инвестиций

Данная статья является продолжением публикации, в которой я рассказывал о созданной мной программе, собирающей все доступные данные по брокерскому счёту клиента Тинькофф Инвестиций через API и формирующей большую Excel таблицу со всеми подробностями, которые вы не всегда найдёте в личном кабинете.

Цель проекта — повысить прозрачность при работе с инвестициями, чтобы держать все свои финансовые потоки под контролем, что должно сделать инвестирование более осознанным, а следовательно, более эффективным.

      Простые запросы SNMP в Python (с помощью pysnmp)

Этот пост предназначен в первую очередь для сотрудников телекома, админов и новичков в разработке, впервые столкнувшихся с необходимостью отправить snmp-запросы к какому-нибудь коммутатору и разобрать полученный ответ.

Разберем основы работы с библиотекой pysnmp на примере модуля, который принимает в качестве параметров oid-ы, ip и RO-community коммутатора и отдает человекопонятный json с ответами на эти oid-ы и ifAdminStatus, ifOperStatus, ifInOctets, ifOutOctets и ответ на запрос о типах линков

Видео

      Moscow Python Podcast. Python в банковской сфере (level: all)

В гостях у Moscow Python Podcast разработчик в Raiffeisen Bank Влад Лоухин. Поговорили с Владом о том, что Python делает в банке, специфике Python в банковской сфере и о многом другом.

Интересные проекты, инструменты, библиотеки

      Lona - Write responsive web apps in full python

Lona is a web application framework, designed to write responsive web apps in full Python


Latest news


  Talk Python to Me: #335: Gene Editing with Python

  На стыке BI и DS: как предоставить аналитикам возможность делать с данными все, что они хотят?

  The Real Python Podcast – Episode #79: Measuring Your Python Learning Progress

  Instagram-бот для улучшения личной жизни

  Работаем с текстами на Python: кодировки, нормализация, чистка

  Геоаналитика с помощью Python и открытых данных: пошаговое руководство

  Объем, центр масс, моменты инерции тела имея только mesh поверхности

  Как я написал свой ChatOps: опыт выпускника курса по Python

  Python Bytes: #251 A 95% complete episode (wait for it)

  Моя клубничная чудо-коробка

  Первые шаги с aiohttp: часть 2. Подключаем базу данных к приложению

  Помощник – «решатель филвордов» на python (алгоритм поиска слов плюс распознавание текста tesseract)

  Python⇒Speed: Scanning your Conda environment for security vulnerabilities

  Решил 50 задач и ответил на вопрос — Python или JavaScript?

  Построение архитектуры проекта при работе с PySpark


Show all




Разместим вашу рекламу

Пиши: mail@pythondigest.ru

Нашли опечатку?

Выделите фрагмент и отправьте нажатием Ctrl+Enter.

Система Orphus