IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     29.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

Pyspark. Анализ больших данных, когда Pandas не достаточно

Pandas - одна из наиболее используемых библиотек Python с открытым исходным кодом для работы со структурированными табличными данными для анализа. Однако он не поддерживает распределенную обработку, поэтому вам всегда придется увеличивать ресурсы, когда вам понадобится дополнительная мощность для поддержки растущих данных. И всегда наступит момент, когда ресурсов станет недостаточно. В данной статье мы рассмотрим, как PySpark выручает в условиях нехватки мощностей для обработки данных.

     29.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

Полное руководство по модулю asyncio в Python. Часть 4

Сегодня, в четвёртой части (первая, вторая, третья) перевода учебного руководства по модулю asyncio в Python, представляем вашему вниманию разделы оригинала №8 и 9.

     29.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

Субъективные итоги года в мире Python

В прошлую пятницу мы собрались в онлайне обсудить, что запомнилось в уходящем году.  Это — текстовая выжимка из выпуска.

     28.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

Обзор пакетов SciPy, Pyomo и CVXPY для решения задач условной оптимизации

В этой статье мы продолжаем говорить про прикладное применение теории оптимизации. В частности, сделаем краткий обзор существующих open-source решений в Python, с которыми мы сталкивались на практике. Затронем их различия и особенности, приводим примеры задач, которые можно решать с их помощью.

     27.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

Задача коммивояжера (TSP) точное решение — метод ветвей и границ

Есть задачи, время выполнения которых столь огромно, что выигрыш в производительности доминирует над всем остальным.Я говорю про NP-трудные задачи (NP-трудность - недетерминированная полиномиальная трудность по времени) и на одной из данного класса хочу акцентировать ваше внимание. Задаче коммивояжера. Мы не будем рассматривать эвристические алгоритмы, нам нужно точное решение.

     27.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

Подойдет ли Python для DWH

Большой проект на любом языке требует к себе вдумчивый подход, особенно в плане учета особенностей языка и технологий. И особенно проект, позволяющий автоматизировать выгрузки и сбор витрин данных. Дата-инженер из inDrive рассказал об устройстве DWH в компании: почему команда выбрала Python основным языком для проекта, а также на примере кейсов разобрал, что в нем может пойти не так.

     27.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

Лучшие новые библиотеки Python за 2022 год

В пост включены библиотеки, которые были запущены или приобрели популярность в этом году, хорошо поддерживаются, а также просто классные и достойные внимания. Подборка в значительной степени ориентирована на библиотеки по ИИ и науке о данных, но сюда так же включен ряд библиотек, которые могут быть полезны для целей, не связанных с наукой о данных.

     27.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

У вас нет причин использовать alpine для python-проектов

По мотивам моего доклада на PyCon "Контейнеризация Python без боли". На своей практике я постоянно сталкиваюсь со спорами какой базовый образ лучше использовать для проектов: alpine или debian. Аргументы есть и у той, и у другой стороны, но мне это настолько надоело, что я решил сам разобраться и наконец-то поставить точку. В конце концов "В наше время верить нельзя никому, даже себе. Но мне - можно." (с)

     26.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

ИИ в конце 2022 года или как ИИ может помочь создать видеоролик

2022 год уходит. Чем же он нам запомнился? Несомненно, одно из последних достижений года - ChatGPT, самая спорная вещь в комьюнити: кто-то говорит “зачем такое создавать, роботы скоро оставят миллионы журналистов, писателей, блогеров, креаторов без работы”, другие же напротив, считают эту сетку огромным прорывом. Вишенка на торте - это, конечно, Stable Diffusion от компании Stability AI. Эта нейронная сеть была выложена в открытый доступ, что сразу привлекло внимание всех разработчиков. И это лишь малая часть того, что появилось в уходящем году.Давай вместе с ИИ создадим полноценное видео и узнаем, возможно ли создавать контент, используя доступные на сегодняшний день достижения нейронных сетей?

     26.12.2022       Выпуск 471 (26.12.2022 - 01.01.2023)       Статьи

Как мы сделали и оптимизировали механизм правил для персонализации UI

В статье расскажу, как мы решали проблему персонализации интерфейса пользователя на бэкенде и с какой проблемой столкнулись через какое-то время.

     24.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Применение генеративно-состязательных нейронных сетей (GAN) в клинических исследованиях

Клинические испытания новых методов лечения делятся на несколько этапов, называемых фазами. На самых ранних этапах испытаний нужно учитывать безопасность лекарственного средства или побочные эффекты, которые оно вызывает. Более поздние фазы испытаний направлены на то, чтобы проверить, лучше ли новое лечение, чем существующие.

Существует 3 основных фазы клинических испытаний — фазы с 1 по 3. Испытания фазы 1 — это самые ранние фазы испытаний, а испытания фазы 3 — испытания более поздней фазы.

Некоторые испытания имеют более раннюю стадию, называемую фазой 0, а некоторые испытания фазы 4 проводятся после того, как лекарство было лицензировано.

     23.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Как (и зачем) я писал README в Jupyter-ноутбуке для Node.js-приложения

На одном из прошлых мест работы я поддерживал консольную Node.js-утилиту, которая публиковалась в NPM. Утилита использовала commander, содержала довольно большое количество подкоманд, и все они требовали описания в README-файле, которое нужно было не забывать обновлять при каждом изменении. Несколько лет спустя я нашел решение, используя не слишком привычные для экосистемы Node.js технологии.В этой статье: много моей любви к Jupyter-подобным ноутбукам, инструкция про то, как затащить Python-пакет в NPM и чуть-чуть анализа трекерной музыки.

     23.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Инструменты для GraphQL клиента на Python

Речь в статье пойдет о специальных инструментах для работы с GraphQL на Python в качестве клиента. Если вы используете GraphQL в своих сервисах на Python, то, скорее всего, сталкивались с необходимостью писать и хранить строки, содержащие GraphQL запросы, а так же писать Python классы для хранения результатов этих запросов. Вероятнее всего, вам было неудобно: не хотелось дублировать схожие запросы, постоянно править классы при частом изменении схемы и т.п. Вот и мне тоже. Поэтому, решая описанные проблемы, появились на свет два пакета: graphql-query и graphql2python.

     23.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Создаем сервис для Serverless перевода голоса, как в Cyberpunk 2077

На днях мне наконец-то удалось поиграть в Cyberpunk 2077, и я заметил, что в игре есть одна интересная особенность: Когда персонаж говорит на иностранном языке, текст сначала появляется над ним в оригинале, а затем как бы вживую переводится на английский.

Тогда я задался вопросом: сколько работы потребуется, чтобы создать нечто подобное с помощью современного DL-стека? Можно ли сделать это за выходные?

     22.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Полосный вокодер на Python: поговорим как роботы

Если честно, сейчас сложно придумать практическое применение для полосного вокодера. Скорее всего, он придется вам по душе, если вы большой любитель ретро-технологий, или — что не исключено — вы начинающая FKA Twigs или Daft Punk и любите играть с футуристичными звуками в своей музыке.

     22.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

YOLOR — Объяснение статьи и выводы – Углубленный анализ

В последние годы наблюдается огромный прогресс в серии YOLO, в настоящее время в ней используются как модели обнаружения объектов без привязки, так и модели обнаружения объектов на основе привязки. Вместо того, чтобы сосредоточиться исключительно на архитектурных изменениях, YoloR выбирает новый маршрут. Он черпает вдохновение в том, как люди сочетают неявные знания с явными знаниями для решения новых задач.

     22.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Как распознать синтезированную речь

В современном мире технологии синтеза речи и клонирования голоса стремительно развиваются и уже достигли впечатляющих результатов. С 2015 года проводится специальное соревнование ASV Spoofing, на котором ежегодно презентуют новые методы проведения спуфинг-атак (атаки, когда один человек или программа маскируется под другую путем фальсификации данных) с помощью видео-дипфейков и синтеза речи. Существующие речевые системы способны синтезировать речь и тембр голоса, на слух неотличимые от настоящих. Технологии клонирования голоса привлекают всё большее внимание и находят широкое применение в таких сферах, как голосовое управление, робототехника, голосовые ассистенты (например, Siri и Алиса) и т.д. Однако вместе с этим открываются новые возможности для мошенничества. Особенно уязвимы системы, использующие голосовую биометрию для идентификации пользователей: используя синтез речи, мошенники могут получить доступ к аккаунтам и данным пользователей.

     21.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Консистентность данных в конкурентной среде. Опыт Точки. Часть 1

Именно в Точке я впервые столкнулся с микросервисами и конкурентной средой. Разумеется, у меня не получилось сразу усвоить все боевые нюансы работы в новых условиях. С тех пор я прошёл непростой путь. У меня возникла идея написать свой цикл статей. Мы разберемся, как у наших сервисов получается не запутаться в непрерывном потоке информации — как получаемой от клиентов, так и передаваемой между собой. В этой статье я широкими мазками опишу, как рядовой разработчик видит инфраструктуру Точки, с какими проблемами мы регулярно сталкиваемся и почему нам так важна консистентность данных Читать далее

     19.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Telegram WebApps. Как встроить веб-приложения в чат-бота?

Относительно недавно команда Telegram выпустила обновление, с которым появилась возможность встраивать в мессенджер веб-приложения. Эта статья — обзор основных моментов внедрения веб-приложениий в телеграм-ботов.