IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     11.10.2023       Выпуск 512 (09.10.2023 - 15.10.2023)       Статьи

Mastering Integration Testing With FastAPI

This article shows you how to use MongoMock and MockS3 to power your integration tests on a FastAPI based project.

     06.06.2023       Выпуск 494 (05.06.2023 - 11.06.2023)       Статьи

Оптимизация выборок в больших коллекциях MongoDB

При работе с большими коллекциями в MongoDB, размер которых превышал десятки миллионов записей, возникла необходимость формировать случайные выборки уникальных значений полей, принадлежащих документам этой коллекции.Для такой операции, в MongoDB штатно предусмотрена функция $sample, которую можно использовать в составе pipeline при проведении агрегации данных. Однако, как показала практика, выполнение выборки полей таким образом на большой коллекции может занимать весьма ощутимое время. Чтобы сократить время выполнения таких выборок, потребовалось разработать собственный алгоритм, который на порядки увеличил скорость работы. Ниже приведен подход и вариант реализации данного алгоритма.

     17.04.2023       Выпуск 487 (17.04.2023 - 23.04.2023)       Статьи

Пишем полезный сервис на Python для получении ИНН

В этой статье хочу рассказать о том, как написать полезный сервис, для получения ИНН по персональным данным (паспортные данные). ИНН физического лица получаем с использование сайта https://service.nalog.ru/. Похожая функциональность, скорее всего, уже где-то и кем-то была реализована. Основная идея статьи - поделиться опытом работы с Python в части создания законченного проекта с использованием контейнера зависимостей, создания слушателей для RabbitMQ и работой с базой данных MongoDB. Работа с клиентами сервиса реализована через RabbitMQ в режиме непрерывного чтения очереди, отправкой результата в выходную очередь. Сервис будет жить в Kubernetes, что требует наличие liveness и readiness проб. Для этого используется веб-сервер.

     12.10.2022       Выпуск 460 (10.10.2022 - 16.10.2022)       Статьи

Ошибки выбора MongoDB в качестве основной БД в стартапе

В этой статье я хочу рассказать о своих ошибках, которые я допустил, когда писал сервис, у которого MongoDB была основной БД для хранения пользовательских данных (да и не только, но об этом ниже).

     10.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Материалы бэкенд-митапа. MongoDB, оптимизация алгоритмов и диагностика проблем в больших проектах

Это пост-отчёт с митапа «Быстрый бэкенд», который прошёл в офисе Joom. С коллегами из Джум Лабс и Авито обсудили, как живётся с большим кластером MongoDB, как битмап-индексы помогают быстро искать по каталогам и как анализировать большие объемы Jaeger-трейсов. В этом посте — видеозаписи докладов, презентации спикеров и несколько фотографий со встречи.

     24.08.2021       Выпуск 401 (23.08.2021 - 29.08.2021)       Статьи

Принимаем на работу брокера для Celery: подбор, аджаст и выкатка

У Яндекса много самописных сервисов для внутренних задач: Яндекс.Формы, Яндекс.Диск, трекер, календарь. Со временем их решили использовать не только внутри компании, но и за ее пределами. Так появилась платформа Яндекс.Коннект.

Большинство сервисов Коннекта построено на Python V3. В качестве web-фреймворка используется Django, реже Flask и Tornado, а новые чаще пишутся на FastAPI. Сервисы, как и базы PostgreSQL, MySQL и MongoDB, живут в облаке. В качестве очереди сообщений почти везде используется Celery с MongoDB в качестве брокера. Он и стал проблемой.

     27.06.2021       Выпуск 392 (21.06.2021 - 27.06.2021)       Статьи

Голосовой дневник на python с распознаванием голоса и сохранением в Mongo DB

Все больше растет популярность голосовых интерфейсов. Многие технологические компании-гиганты стремятся сделать своего голосового помощника. Но речевые технологии доступны и обычным пользователям. Каждый может использовать их в своих проектах и делать голосовые интерфейсы еще удобнее и популярнее .

Голосовой дневник - лишь один из примеров того, как можно встроить функции голосового интерфейса в повседневные действия.

     02.04.2021       Выпуск 380 (29.03.2021 - 04.04.2021)       Статьи

Аспекты учета и поиска геоинформационных объектов с задействованием MongoDB

Геоинформация - это любые сведения, отражающие расположение, форму и размеры объекта (далее - геообъект). Ее учет ведется в картографии, геологии, метеорологии, землеустройстве, экологии, муниципальном управлении, транспорте, экономике, обороне и многих других областях. Геоинформация является неотъемлемой частью так называемых Больших данных, что приводит к необходимости разработки средств ее анализа и визуализации.

     26.01.2021       Выпуск 371 (25.01.2021 - 31.01.2021)       Статьи
     16.09.2020       Выпуск 352 (14.09.2020 - 20.09.2020)       Статьи
     18.02.2020       Выпуск 322 (17.02.2020 - 23.02.2020)       Статьи
     23.07.2019       Выпуск 292 (22.07.2019 - 28.07.2019)       Статьи

Деплоим ML проект, используя Flask как REST API, и делаем доступным через приложение на Flutter

Машинное обучение уже везде и, пожалуй, почти невозможно найти софт, не использующий его прямо или косвенно. Давайте создадим небольшое приложение, способное загружать изображения на сервер для последующего распознавания с помощью ML. А после сделаем их доступными через мобильное приложение с текстовым поиском по содержимому.

 

Мы будем использовать Flask для нашего REST API, Flutter для мобильного приложения и Keras для машинного обучения. В качестве базы данных для хранения информации о содержимом изображений используем MongoDB, а для получения информации возьмём уже натренированную модель ResNet50. При необходимости мы сможем заменить модель, используя методы save_model() и load_model(), доступные в Keras. Последний потребует около 100 Мб при первоначальной загрузке модели. Почитать о других доступных моделях можно в документации.

     21.02.2019       Выпуск 270 (18.02.2019 - 24.02.2019)       Статьи
     10.11.2018       Выпуск 255 (05.11.2018 - 11.11.2018)       Статьи

Совершеннолетняя журналистика: от России до Кремля

Анализ публикаций Lenta.ru за 18 лет (с сентября 1999 по декабрь 2017 гг.) средствами python, sklearn, scipy, XGBoost, pymorphy2, nltk, gensim, MongoDB, Keras и TensorFlow.

     12.10.2017       Выпуск 199 (09.10.2017 - 15.10.2017)       Статьи

Обзор фреймворка Luigi для построения последовательностей выполнения задач

Luigi — фреймворк на языке Python для построения сложных последовательностей по выполнению зависимых задач. Довольно большая часть фреймворка направлена на преобразования данных из различных источников (MySql, Mongo, redis, hdfs) и с помощью различных инструментов (от запуска процесса до выполнения задач разных типов на кластере Hadoop). Разработан в компании Spotify и открыт в виде open source инструмента в 2012 году.

     27.04.2017       Выпуск 175 (24.04.2017 - 30.04.2017)       Статьи

Как работать с MongoDB из Python

Описываются стандартные операции работы с БД

     07.02.2017       Выпуск 164 (06.02.2017 - 12.02.2017)       Статьи

Отслеживаем события MongoDB драйвера в Motor

Motor позволяет в асинхронном режиме следить за процессом выполнения запроса в MongoDB

     12.12.2016       Выпуск 156 (12.12.2016 - 18.12.2016)       Статьи
     20.10.2016       Выпуск 148 (17.10.2016 - 23.10.2016)       Статьи
     28.04.2016       Выпуск 123 (25.04.2016 - 01.05.2016)       Статьи

Piter Py #3 — личные впечатления pycon

В минувшие выходные прошла третья конференция питонистов в Питере — Piter Py #3 (http://it-sobytie.ru/events/5862). Конференция длилась три дня, была наполовину англоязычной, все эти дни слова "Docker", "Mongo", "Ansible" произносились даже чаще, чем "Python". И здесь я впервые услышал о существовании YAML-программистов. Делюсь собственными впечатлениями и, полагаю, выражаю мнение большинства других посетителей.