Выпуск 393

(28.06.2021 - 04.07.2021)

pythondigest.ru: Выпуск 393

Статьи

      Нетривиальное слияние репозиториев с помощью git-filter-repo

Это вторая часть истории про слияние репозиториев. Суть проблемы вкратце такова: надо слить репозиторий с подрепозиторием с сохранением истории. Решение на gitpython работало за 6 часов и выдавало удовлетворительный результат. Но переизбыток свободного времени и врождённая любознательность привели меня к знакомству с волшебным миром git-filter-repo.

      Автоматизируем работу с контейнерами через Makefile: сборка, тестирование и развёртывание за один вызов make

Утилита make позволяет просто управлять контейнерами, объединив команды для сборки, тестирования и развёртывания в одном конфигурационном файле.

      Сводка новостей от pythonz 27.06.2021 — 04.07.2021

А теперь о том, что происходило в последнее время на других ресурсах.

      Dramatiq как современная альтернатива Celery: больше нет проблем с версиями и поддержкой Windows

Использование Dramatiq как очередь задач и простой пример асинхронной задачи.

      Перефразирование русских текстов: корпуса, модели, метрики

Автоматическое перефразирование текстов может быть полезно в куче задач, от рерайтинга текстов до аугментации данных. В этой статье я собрал русскоязычные корпуса и модели парафраз, а также попробовал создать собственный корпус, обучить свою модель для перефразирования, и собрать набор автоматических метрик для оценки их качества.В итоге оказалось, что модель для перевода перефразирует лучше, чем специализированные модели. Но, по крайней мере, стало более понятно, чего вообще от автоматического перефразирования можно хотеть и ожидать.

      Хранилище внешних обработок 1С на python

Хотелось бы поделиться своим опытом создания простенького хранилища внешних обработок 1С. Если Вы программист 1С и ваши коллеги постоянно затирают вам код внешних обработок то это статья для вас! Читать далее

      Python: неочевидное в очевидном

Изучение любого языка - очень долгий процесс, в ходе которого могут возникать ситуации, когда очевидные с виду вещи ведут себя странно. Даже спустя много лет изучения языка не все и не всегда могут с уверенностью сказать “да, я знаю этот на 100%, несите следующий”.

Python - один из самых популярных языков программирования на сегодняшний день, но и он имеет ряд своих нюансов, которые на протяжении многих лет изменялись, оптимизировались и теперь ведут себя немного не так, как это может показаться, глядя на строчки незамысловатого кода.

      Кластеризация трасс для оценки качества процессов

Бывают такие случаи в анализе процессов, когда данных не очень много, а действия в процессах хаотичны. И что делать? Конечно, анализировать. Для этого будем использовать привычные инструменты: python и excel. И иногда гугл.

      Python⇒Speed: Measuring the memory usage of a Pandas DataFrame

How much memory are your Pandas DataFrame or Series using? Pandas provides an API for measuring this information, but a variety of implementation details means the results can be confusing or misleading.

 

      ML-обработка результатов голосований Госдумы (2016-2021)

Недавно я наткнулся на сайт vote.duma.gov.ru, на котором представлены результаты голосований Госдумы РФ за весь период её работы — с 1994-го года по сегодняшний день. Мне показалось интересным применить некоторые техники машинного обучения, а так же обычной статистической обработки для выяснения следующих вопросов.

      Сохраняем комментарии youtube в csv

Пошаговая инструкция для сохранения всех комментариев с youtube видео в csv

      TensorFlow vs PyTorch в 2021: сравнение фреймворков глубокого обучения

Меня зовут Дмитрий, я занимаюсь разработкой в области компьютерного зрения в команде MTS AI. Так исторически сложилось, что в своей работе я использую, как правило, связку устаревшей версии TensorFlow 1 и Keras. Пришло время двигаться дальше, но прежде чем полностью перейти на TensorFlow 2, я решил сравнить наиболее популярные на сегодня фреймворки глубокого обучения: TensorFlow и PyTorch. Эта статья будет полезна всем Data Scientist'ам, кто желает узнать чуть больше про особенности и производительность TensorFlow и PyTorch.

      Тесты на антиутопию: искусственный интеллект GPT-J-6B пишет программный код (попутно раскрывая план восстания машин)

Компания OpenAI отказалась открывать исходный код алгоритма обработки естественного языка третьего поколения (модель называется GPT-3, имеет 175 миллиардов параметров). Поэтому другие компании разрабатывают свои модели. Они имеют меньше параметров, но похожую архитектуру и после обучения тоже показывают впечатляющие результаты.

      Использование модуля decimal в Python

В данном руководстве мы рассмотрим использование модуля для работы с десятичными числами, который включен в стандартную библиотеку Python.

      How to use Python’s HTTPStatus with Django

A “magic number” is the anti-pattern of using a number directly rather than storing it in a descriptive variable name. In web code HTTP status codes are often used as magic numbers, perhaps because web developers memorize common codes such as 200 and 404. In Python, we can avoid such magic with descriptive references from the standard library’s http.HTTPStatus enum.

Let’s look at two ways to use HTTPStatus in our Django code.

      Tesseract OCR, выделение распознанного текста на изображении

Прочитать картинку, сохранить текст, обработать текст, получить результат довольно просто. Хочу рассказать как этот результат отобразить для пользователя на ранее прочитанной картинке, например выделить кусочек текста содержащий целевое предложение. Такая задача будет полезна при выделении важной части текста и демонстрации её руководству в виде картинки.

Видео

      Moscow Python Podcast. Как пет-проджекты помогают в самообразовании (level: all)

В гостях у Moscow Python Podcast разработчик компании Klarna Игорь Масягин. Обсудили с Игорем зачем нужны пет-проджекты, их пользу и его опыт.

Интересные проекты, инструменты, библиотеки

      css-inline - Blazing fast CSS inliner

The project inlines CSS styles into "style" attributes. Written in Rust with Mozilla's Servo project components


Latest news


  Talk Python to Me: #335: Gene Editing with Python

  На стыке BI и DS: как предоставить аналитикам возможность делать с данными все, что они хотят?

  The Real Python Podcast – Episode #79: Measuring Your Python Learning Progress

  Instagram-бот для улучшения личной жизни

  Работаем с текстами на Python: кодировки, нормализация, чистка

  Геоаналитика с помощью Python и открытых данных: пошаговое руководство

  Объем, центр масс, моменты инерции тела имея только mesh поверхности

  Как я написал свой ChatOps: опыт выпускника курса по Python

  Python Bytes: #251 A 95% complete episode (wait for it)

  Моя клубничная чудо-коробка

  Первые шаги с aiohttp: часть 2. Подключаем базу данных к приложению

  Помощник – «решатель филвордов» на python (алгоритм поиска слов плюс распознавание текста tesseract)

  Python⇒Speed: Scanning your Conda environment for security vulnerabilities

  Решил 50 задач и ответил на вопрос — Python или JavaScript?

  Построение архитектуры проекта при работе с PySpark


Show all




Разместим вашу рекламу

Пиши: mail@pythondigest.ru

Нашли опечатку?

Выделите фрагмент и отправьте нажатием Ctrl+Enter.

Система Orphus