IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     18.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

Заметки про увеличение картинок нейронными сетями

TLDR — это не готовое решение, это попытка самостоятельно разобраться, подобрать архитектуру и обучить генеративно-состязательную модель (GAN) для увеличения картинок в 2 или 4 раза. Я не претендую на то, что моя модель или путь рассуждений лучше каких-то других. Кроме того, относительно недавно стали популярны трансформеры и diffusion модели — заметки не про них.

     18.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

Сводка новостей от pythonz.net 11.06.2023 — 18.06.2023

А теперь о том, что происходило в последнее время на других ресурсах.

     15.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

Apache Airflow в связке с Kubernetes

В этой статье я поделюсь опытом в работе Apache Airflow в связке с Kubernetes. Мы соберем собственный образ Docker с python-скриптом, установим Airflow в Kubernetes, настроим автоматическую синхронизацию DAG'ов с удалённым репозиторием и их исполнение. Всё это — на примере запуска простейшего DAGа.

     14.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

Мокинг внешних API в Python

В этом руководстве я покажу, как протестировать использование внешнего API с помощью Python моков. Интеграция со сторонними приложениями — отличный способ расширить функциональность любого продукта. Однако дополнительные возможности продукта сопряжены с определенными препятствиями. Если вы не являетесь владельцем внешней библиотеки, у вас не получится контролировать серверы, на которых она размещена, код, составляющий ее логику, или данные, которые передаются между ней и приложением. Кроме того, пользователи постоянно воздействуют на данные при взаимодействии с библиотекой.

     14.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Вопросы и обсуждения

Python Bytes: #340 Snorkel not included

Очередной выпуск англоязычного подкаста Python Bytes

     14.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

Что такое индексация смарт-контрактов в Web3 разработке?

Статья в которой я скомпилировал знания полученные в течение года работы в web3 инфраструктурном провайдере о данных на EVM блокчейнах и инструментах разработчика для доступа к ним. Сложно сказать, что культура инженерии данных глубоко укоренилась в сообществе разработчиков Web3. И не каждый разработчик может легко определить, что означает индексация в контексте Web3. Я хотел бы уточнить некоторые детали на эту тему и поговорить об инструменте под названием The Graph, который стал де-факто стандартом индустрии для доступа к данным на блокчейне для создателей DApp'ов (децентрализованных приложений).

     13.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

Shawarma as a service: как создать бота для заказа шавермы и оставить голодными лишь 1,1% коллег

В этой статье я расскажу, как мы автоматизировали организацию шавадея, написав бота, как Telegram вставлял палки в колеса, как я с этим боролся и что в итоге получилось. В конце вас ждет статистика, которая покажет вкусовые предпочтения разработчиков и «охваты» традиции. А еще ответит на вопрос, сколько людей остались без еды из-за бэкэндера, который до этого никогда не занимался проектированием пользовательских интерфейсов.

     13.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

Роли ChatGPT, которые первыми начинают диалог с клиентом и добивается поставленной бизнес задачи

Давайте представим сервис, предоставляющий любому бизнесу виртуального сотрудника, который умеет писать первым в популярные мессенджеры клиентам компании или коллегам и в рамках диалога выполнять поставленную бизнес-задачу.В этой статье я расскажу Вам как мы начинаем строить такой сервис и дам всем желающим попробовать написать свою бизнес-роль.

     13.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

cv3 — делаем OpenCV питоничным

cv3 - это более питоничный интерфейс к OpenCV. Он упрощает работу с этой библиотекой, расширяет его синтаксические возможности, а также ускоряет исследования в области компьютерного зрения и выполнение задач по обработке изображений, при этом сохраняя гибкость и функциональность OpenCV.

     12.06.2023       Выпуск 495 (12.06.2023 - 18.06.2023)       Статьи

Автоматизация видеонаблюдения

В перечень обязанностей входит и администрирование систем видеонаблюдения [мы используем CTV и HiWatch], это обычная ситуация админ должен уметь все и сразу. Информацией в данной статьей я хочу поделиться в виду того, что потребовалось не мало времени для поиска решения задачи и написания небольшого скрипта.

     10.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив

Одна из типовых задач аналитика — посчитать что-то на pySpark, а потом выгрузить это. Например: маленькую табличку в экселе, чтобы сделать отчёт или презентацию; большую таблицу в экселе или csv, чтобы отправить коллегам — до нескольких Гб; большой датасет для обучения ML-модели — до 100 Гб.

     10.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

Задача коммивояжёра — ещё немного больше, ещё немного быстрее

Мы продолжаем наше путешествие в мир алгоритмов поиска оптимального пути.В прошлой работе мы уже узнали, как можно найти оптимальный путь в графе в несколько сотен вершин. В данной работе хочу более подробно остановится на сути метода, а также разобрать возможность по его ускорению на графах от тысячи элементов.

     09.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи
     08.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

А/Б тесты с метрикой отношения. Дельта-метод

В этой статье разберём, что такое метрики отношения. Узнаем, почему критерий Стьюдента не работает. Попробуем применить бутстреп к зависимым данным. Изучим дельта-метод — способ оценки А/Б тестов с метрикой отношения.

     08.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

Сказ о том, как специалисты IT-поддержки скрипты писали…

Сегодня мы немного расскажем вам о работе IT-поддержки: что мы делаем и зачем, как используем Python и как именно он нам помогает решать рутинные проблемы и не только.Опытным коллегам, пишущим на Python, мы не раскроем каких-то сакральных тайн с точки зрения кода, а вот аналитикам, возможно, поможем усовершенствовать процессы.

     08.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

Каждому первоклашке свой «школьный» контроллер

Предлагаю, продолжить разговор на тему «Что делать с детьми летом, если ты айтишник». Сегодня, как договаривались — про hard.Родной российский чиновник не перестает нас умилять: дескать нужны стране IT-шники. А электронщики — те вообще нужны! Прямо позарез!

     07.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

Заставляем трансформеров отвечать на вопросы

Интеллектуальные системы призваны облегчать жизнь человека, выполняя за него рутинные задачи. Одной из таких задач является поиск информации в большом количестве текста. Возможно ли и эту задачу перенести на плечи интеллектуальных систем? Этим вопросом я решил задаться.

     07.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

Poetry: from zero to hero

Данная статья представляет собой руководство по Poetry. Я постарался покрыть все основные сценарии использования и возможности данного инструмента: создание проекта, работа с зависимостями из различных источников, управление виртуальными окружениями, сборка и публикация.

     07.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

Сингулярность, в результате которой ИИ сам сделает себя умнее людей. GPT-4 играет в Minecraft и самообучается

В этой статье речь пойдет об эксперименте Voyager: An Open-Ended Embodied Agent with Large Language Models, в котором группа исследователей (Guanzhi Wang, Yuqi Xie, Yunfan Jiang, Ajay Mandlekar, Chaowei Xiao, Yuke Zhu, Linxi Fan, Anima Anandkumar ) дала GPT-4 поиграть в Minecraft.

     06.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

Оптимизация выборок в больших коллекциях MongoDB

При работе с большими коллекциями в MongoDB, размер которых превышал десятки миллионов записей, возникла необходимость формировать случайные выборки уникальных значений полей, принадлежащих документам этой коллекции.Для такой операции, в MongoDB штатно предусмотрена функция $sample, которую можно использовать в составе pipeline при проведении агрегации данных. Однако, как показала практика, выполнение выборки полей таким образом на большой коллекции может занимать весьма ощутимое время. Чтобы сократить время выполнения таких выборок, потребовалось разработать собственный алгоритм, который на порядки увеличил скорость работы. Ниже приведен подход и вариант реализации данного алгоритма.