24.08.2021 Выпуск 401 (23.08.2021 - 29.08.2021) Статьи

Принимаем на работу брокера для Celery: подбор, аджаст и выкатка

У Яндекса много самописных сервисов для внутренних задач: Яндекс.Формы, Яндекс.Диск, трекер, календарь. Со временем их решили использовать не только внутри компании, но и за ее пределами. Так появилась платформа Яндекс.Коннект.

Большинство сервисов Коннекта построено на Python V3. В качестве web-фреймворка используется Django, реже Flask и Tornado, а новые чаще пишутся на FastAPI. Сервисы, как и базы PostgreSQL, MySQL и MongoDB, живут в облаке. В качестве очереди сообщений почти везде используется Celery с MongoDB в качестве брокера. Он и стал проблемой.

23.08.2021 Выпуск 401 (23.08.2021 - 29.08.2021) Статьи

Your First OCR Project with Tesseract and Python

23.08.2021 Выпуск 401 (23.08.2021 - 29.08.2021) Статьи

Comparing Datetime with Delorean in Python - With and Without Timezones

23.08.2021 Выпуск 401 (23.08.2021 - 29.08.2021) Статьи

Как автоматизировать сбор статистики из Яндекс.Дзен при помощи кода

У Яндекс.Дзен нет готового API, чтобы агрегировать статистику привычным для аналитиков и маркетологов образом. Чтобы собрать данные, нужно пройти 8 шагов: зайти на zen.yandex.ru, перейти в кабинет, затем в раздел «Статистика», потом на вкладку «Кампании», выбрать период и нажать на «Отчеты». Затем в сформировавшихся отчете Excel перейти на вкладку «Статистика кампаний по дням», выбрать нужную кампанию и создать сводную таблицу.

23.08.2021 Выпуск 401 (23.08.2021 - 29.08.2021) Учебные материалы

The Digital Cat Books - Clean Architectures in Python

A new home for the book "Clean Architectures in Python" that can be read online for free and is published in PDF by Leanpub. This website will host other books in the future, stay tuned!

22.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Статьи

ETL в задаче анализа данных для тех, кто не любит кофе и курилку

В первую очередь, материал ориентирован на аналитиков, которые манипулируют разумными объемами данных, необходимых для решения практических задач. ETL из Бигдаты в котором перекачиваются сотни Тб ежесуточно живет своей отдельной жизнью.

22.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Статьи

Сводка новостей от pythonz 15.08.2021 — 22.08.2021

А теперь о том, что происходило в последнее время на других ресурсах.

22.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Вопросы и обсуждения

Weekly Python StackOverflow Report: (cclxxxix)

23.08.2021 Выпуск 401 (23.08.2021 - 29.08.2021) Статьи

Python Datetime Module

21.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Вопросы и обсуждения

Talk Python to Me: #330: Apache Airflow Open-Source Workflow with Python

Audio

21.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Вопросы и обсуждения

Test and Code: 163: pip install ./local_directory - Stéphane Bidoul

Audio

22.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Статьи

Why I use attrs instead of pydantic

20.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Вопросы и обсуждения

The Real Python Podcast – Episode #74: Python's Assignment Expressions and Fixing a Botched Release to PyPI

Audio

20.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Статьи

predict_proba в Python не прогнозирует вероятности (и как с этим бороться)

Специалисты по анализу данных часто оценивают свои прогностические модели с точки зрения точности и погрешности, но редко спрашивают себя:

«Способна ли моя модель спрогнозировать реальные вероятности?»

Однако точная оценка вероятности чрезвычайно ценна с точки зрения бизнеса (иногда она даже ценнее погрешности). Хотите пример?

19.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Вопросы и обсуждения

Podcast.init: Growing And Supporting The Data Science Community At Anaconda

Audio

19.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Статьи

Finereader, Tesseract и Easyocr или нуджно ли срочно менять инструмент для OCR

По сравнению со старшими товарищами, EasyOCR очень молодой проект, но с большими амбициями. В статье приводится сравнение качества работы, удобства работы, особенности установки и производительности трёх инструментов.

Одна из популярных задач в аудиторской практике – распознавание текста с документов. Казалось бы, инструменты для решения этой задачи давно известны, всё работает и ничего больше особо и не хочется: бесплатно и руками – Tesseract, платно и легко в использовании – FineReader.

19.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Вопросы и обсуждения

Podcast.init: Making Automated Machine Learning More Accessible With EvalML

Audio

17.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Статьи

Структура + предположения > ML? Моделирование продаж байесовскими методами

Не так давно участвовал в проекте, где мы применяли методы байесовского моделирования для ритейлинговой сети. Тема непростая и интересная. Так как проект под NDA, решил на примере похожего гипотетического проекта показать, как мы решали поставленные перед нами задачи.Также подробно расскажу об основах Байесовского моделирования. Ну и бонусом, тем кто дочитает до конца и захочет углубиться в эту тему – «куча» ссылок.

16.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Статьи

Functools – сила функций высшего порядка в Python

В стандартной библиотеке Python есть множество замечательных модулей, которые помогают делать ваш код чище и проще, и functools определенно является одним из них. В этом модуле есть множество полезных функций высшего порядка, которые можно использовать для кэширования, перегрузки, создания декораторов и в целом для того, чтобы делать код более функциональным, поэтому давайте отправимся на экскурсию по этому модулю и посмотрим, что он может нам предложить.

16.08.2021 Выпуск 400 (16.08.2021 - 22.08.2021) Статьи

Как устроен Domain-Driven Design

Многие проекты на Django начинаются просто: есть база данных и к приложению, которое крутится на сервере, идут обращения. Например, так начиналась Dodo IS (информационная система компании Додо Пицца, где работал автор сегодняшней статьи). Но если использовать Django из коробки, можно натворить много бед и встретить пачку антипаттернов. Возможно, вы встречали такое на старых legacy-проектах.

Все Только на русском Только на английском

IT-новости про Python, которые стоит знать