IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram


Новый материал в ленте

Python Дайджест. Выпуск 517

(13.11.2023 - 19.11.2023)

поделиться выпуском 
Дайджест python,

Статьи

  Разработка алгоритмов обработки данных в реальном времени на Python

С появлением больших объемов информации и необходимостью обработки данных в реальном времени, разработчиками все чаще приходится создавать эффективные алгоритмов обработки данных, способных обеспечивать высокую отзывчивость и мгновенное реагирование на изменения.

  Хакатоним эффективнее: как поднять удаленный сервер MLflow Tracking для команды

Хакатон – это всегда повышенный стресс, потому что за короткое время нужно найти лучшее решение для поставленной задачи. Вам придется обучить десятки моделей, найти оптимальную комбинацию гиперпараметров и при этом координировать действия с командой. Чтобы минимизировать хаос совместной разработки, предлагаю воспользоваться MLflow Tracking. С его помощью вы сможете синхронизировать усилия всей команды, а также иметь доступ к истории всех экспериментов: к обученным моделям, их гиперпараметрам, метрикам и не только. 

  Практический гайд по процессам и потокам (и не только) в Python

За время менторства начинающих разработчиков заметил, что большинство вопросов связаны с темами: конкурентность, параллелизм, асинхронность. Их часто задают на собеседованиях, а в работе эти знания позволяют писать более эффективные и производительные системы. Поэтому я решил систематизировать свое видение и опыт в виде статьи.

  Обработка результатов статистических наблюдений с помощью толерантных интервалов

При определении понятия толерантного интервала, в качестве примера, будем рассматривать функцию плотности вероятности стандартного нормального распределения. На рисунках 1 и 2 изображены квантили распределения - значения, которые случайная величина не превышает с заданной вероятностью

  Исследование режима Copy-on-Write в pandas. Часть 3

Появление в библиотеке pandas режима Copy‑on‑Write (CoW, копирование при записи) — это изменение, нарушающее обратную совместимость, которое окажет некоторое воздействие на существующий код, использующий pandas. Мы разберёмся с тем, как адаптировать код к новым реалиям, сделать так, чтобы он работал бы без ошибок тогда, когда режим CoW будет включён по умолчанию.

  Rust vs. Go, Java, and Python in AWS Lambda Functions

A performance comparison of JSON parsing in AWS Lambda functions using Rust, Go, Java, and Python.

  Особенности сбора метрик. Запуск приложения gunicorn-ом в режиме мультипроцессинга

Представим следующую ситуацию. Ваш python веб-сервер собирает какие-то метрики prometheus_client-ом: счётчики, гистограммы и т. д, например, количество входящих запросов. Вы также настроили приложение, чтобы /metrics возвращал все ваши метрики. Если режим работы prometheus_client-a оставить по умолчанию, при запуске приложения gunicorn-ом с более чем одним воркером вы сталкиваетесь с проблемой консистентности метрик.

  Использование Insightface для быстрого поиска и сравнения лиц на изображениях

Сегодня рассмотрю кейс поиска «близнецов» в паспортных данных, которые были размещены в pdf‑файлах, насчитывающих десятки, а порой и сотни страниц.

  Анализ текстовых данных с помощью NLTK и Python

NLTK предлагает удобные инструменты для множества задач NLP: токенизация, стемминг, лемматизация, морфологический и синтаксический анализ, а также анализ настроений. Библиотека идеально подходит как для начинающих, так и для опытных разработчиков, предоставляя интуитивно понятный интерфейс и обширную документацию.

  Управление сетевыми устройствами: Orange Pi, OpenWRT и Python

Рассмотрим использование Orange Pi с установленной на нем OpenWRT и разработанном на языке Python скрипте. Имея под рукой такие инструменты, попробуем создать собственную сетевую систему управления! В конечном итоге, вы сможете самостоятельно и легко воспроизвести этот пример и адаптировать его под свои нужды, открывая новые возможности в области управления сетевыми устройствами.

  Создание видео zoom in и zoom out с помощью inpainting в Kandinsky

Развитие text2image-моделей открывает новые интересные возможности для создания креативного контента. Функция inpainting в Kandinsky от Sber AI позволяет создавать видео zoom in и zoom out с иллюзией приближения или отдаления от единого изображения.

  Асинхронный python без головной боли (часть 3)

Ну вот и пришла пора погрузиться в недра asyncio и подробнее познакомиться с циклом событий. С его помощью мы научимся писать собственные асинхронные веб-серверы, создавать асинхронные драйверы внешних устройств и справляться с вычислительно-затратными задачами в асинхронных приложениях.

  Python + pygame — небольшие оптимизации

В процессе разработки я сталкиваюсь с различными проблемами и в мой мозг приходят весьма интересные решения для оптимизации, которыми я бы хотел поделиться с теми, кто тоже захотел написать крутую игру на python.

  Клонирование голоса из музыки, удаление движимого текста из видео и новые фишки во второй части обновления Wunjo AI

Я завершил работу над второй частью обновления open-source проекта Wunjo AI и воплотил своё видение приложения. В этом обновлении основное внимание уделено звуку: улучшено клонирование голоса, извлечение вокала или мелодии из песен и повышение качества речи. Но это не все, также появились новые функции для работы с видео и создания дипфейков. Давайте рассмотрим все по порядку: начнем с звука и перейдем к видео и дипфейкам.

  Как я реверс-инженерил китайский блютуз контроллер

Создание цветомузыки посредством реверс инженеринга блютуз контроллера и анализа звукового потока через golang.

Релизы

  kombu - 5.3.4

Фреймворк для работы с AMQP. Скачать можно по ссылке: https://pypi.python.org/pypi/kombu/

  jsonschema - 4.20.0

Валидатор JSON данных. Скачать можно по ссылке: https://pypi.python.org/pypi/jsonschema

  Pygments - 2.17.1

Инструмент подсветки синтаксиса. Скачать можно по ссылке: https://pypi.python.org/pypi/Pygments/

  django-angular - 2.3.1

Приложение для работы с Angular.js в Django. Скачать можно по ссылке: https://pypi.python.org/pypi/django-angular/

  numpy - 1.26.2

Модуль для работы с многомерными массивами. Скачать можно по ссылке: https://pypi.python.org/pypi/numpy/

  aiohttp - 3.9.0

http клиент/сервер для asyncio. Скачать можно по ссылке: https://pypi.python.org/pypi/aiohttp