IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     12.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Видео

Обработка свыше 400М прод. событий в сутки

В KION в сутки поступает свыше 400 миллионов продуктовых событий (помимо технических). На основе этих событий продуктовые вертикали строят аналитику, следят за продуктом, принимают бизнес решения. Качество поступаемых данных критично важно. В докладе расскажу про весь pipeline событий, как мы их готовим для аналитиков и продактов.

     12.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Видео

Токены отмены как паттерн и как библиотека cantok.

Код на C# и на Go часто пронизан специальными объектами, отвечающими за прекращение работы — они называются токенами отмены, либо в случае Go — контекстами. Это супер-удобно и делает программы компактнее + надежнее, но питонисты про такое почему-то не в курсе. Мне пришлось решать эту проблему и написать свой инструмент + начать популяризировать паттерн.

     12.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Видео

Классификация запросов клиентов. Дёшево и сердито

Когда у вас достаточно большой и разношёрстный спектр запросов клиентов, а вам необходимо все это валидировать, и на это нет ресурсов в виде LLM или NN — "Что же делать?". Расскажу, как сделать классификацию быстро и без больших затрат на разметку и обучение.

     11.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Как мы делаем опенсорс курсы для программистов от программистов

Мы разочаровались в курсах по программированию и поэтому сделали свои собственные. Не для вайтишников, а для типичных разрабов. В процессе нас хакнул инфлюенсер и забанил сервер телеграма. Покоцанные, но не сломленные, мы представляем проект, над которым работали полтора года по ночам. Курсы по программированию с задачами в online IDE и прагматичной теорией. Никаких сертификатов и гарантий трудоустройства. Сплошной хардкор и опенсорс!

     11.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Индуктивная статистика: доверительные интервалы, предельные ошибки, размер выборки и проверка гипотез

Одной из самых распространённых задач современной аналитики является формирование суждений о большой совокупности (например, о миллионах пользователей приложения), опираясь на данные лишь о небольшой части этой совокупности - выборке. Можно ли сделать вывод о миллионной аудитории крупного мобильного приложения, собрав данные об использовании лишь для 100 пользователей?

     10.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Tutorial: в gigachat появился function calling

Недавно в документации к API GigaChat появился раздел, посвящённый работе с функциями, аналогично тому, как это реализовано в ChatGPT. Идея заключается в том, что модели передаётся информация о доступных ей функциях, и в зависимости от запроса пользователя модель может обратиться к этим функциям и добавить их результат к промту для генерации ответа

     10.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Реализация взаимодействия с БД через Middleware в Telegram-ботах

Когда я начинал писать своих первых ботов с использованием базы данных, их код был очень плохим: он расходовал лишние ресурсы, а также была плохая архитектура проекта. Поэтому я хочу поделиться с вами своими знаниями, чтобы вы не наступали на те грабли, на которые наступал я. В проекте бота, который будет использован в качестве примера в данной статье, я использовал такие технологии, как aiogram, SQLAlchemy, alembic и Docker. В качестве СУБД выступает PostgreSQL

     10.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Вопросы и обсуждения

Python Bytes: #378 Python is on the edge

Очередной выпуск англоязычного подкаста Python Bytes

     10.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Интеграция Grist и Metabase

Мы построили DWH из Open-source продуктов. В этой статье расскажу, какие продукты мы используем, какие хитрости придумали для работы с ними как вся система работает вместе.

     08.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Разбор задач «Квеста на миллион»

Разбираем задачи прошедшего квеста на миллион. Для простоты, в разборе будем использовать формализованные формулировки задачи. Ознакомиться с исходными формулировками можно в самом квесте. Квест открыт и доступен для прохождения.

     08.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Python для анализа годовых температур в Москве

Давайте на примере анализа годовых температур в Москве разберемся как с его помощью можно выгрузить, предобработать и визуализировать данные новичку в этом деле.

     08.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Мега-Учебник Flask Глава 3: Веб-формы (издание 2024)

В главе 2 я создал простой шаблон для домашней страницы приложения и использовал поддельные объекты в качестве заполнителей для того, чего у меня еще нет, например, пользователей и записей в блоге. В этой главе я собираюсь устранить одно из многих недостатков, которые у меня все еще есть в этом приложении, в частности, как принимать входные данные от пользователей через веб-формы.

     07.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Класс Reverse Mapping на Python

В процессе разработки часто приходится использовать словари для получения значения по ключу. Это отлично подходит для маппинга полей различных систем. Например, в одной системе тип документа "Договор", а в другой "Contract". Либо одна система принимает буквенный код валюты "RUB", а другая числовой "643". Для того чтобы они понимали друг друга, необходимо переводить значения в понятные для этой системы, и для этого прекрасно подходят словари.

     07.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Сказ о том, как я эмулятор Intel 4004 на Python писал (часть 2)

Это вторая часть о том, как я писал и продолжаю писать и улучшать эмулятор Intel 4004 с очень ограниченным функционалом на языке Python. В этот раз я решился переписать эмулятор с нуля, исправив довольно весомые ошибки предыдущего эмулятора..

     07.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Сводка от pythonz net 31.03.2024 — 07.04.2024

А теперь о том, что происходило в последнее время на других ресурсах.

     07.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Pandas: от хаоса к красоте кода

Работа с pandas.DataFrame может превратиться в неловкую кучу старого (не очень) доброго спагетти-кода. Я и мои коллеги часто используем эту библиотеку, и хотя мы стараемся придерживаться хороших практик программирования, таких как разделение кода на модули и модульное тестирование, иногда мы все равно мешаем друг другу, создавая запутанный код.

     05.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Как перезапускать PySpark-приложение и зачем это может понадобиться

Мы используем PySpark, который позволяет очень быстро распределённо обрабатывать данные в оперативной памяти узлов нашего кластера на базе Hadoop. Я поделюсь способом, с помощью которого можно снизить потребление ресурсов кластера за счёт перезапуска PySpark-приложений между выполняемыми Spark-задачами, и расскажу, как это делать правильно.

     05.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Универсальные типы в python

Универсальные типы в python являются незаменимым инструментом, который позволяет выявлять множество ошибок на моменте написания кода, а также делает код чище и элегантнее.

     04.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Синтетическое генерирование данных (SMOTE)

Почему несбалансированные данные — это большая проблема? К примеру у нас есть набор данных, где один класс значительно преобладает над другим. В такой ситуации наша ml моделька может просто "забить" на малочисленный класс, сосредоточившись на многочисленных классах. Это приводит к ситуации, когда модель хорошо работает на общем уровне, но плохо распознаёт важные исключения или редкие случаи.

     04.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Мониторинг Apache Airflow. Оценка «прожорливости» тасок

Случались ли у вас ситуации, когда количество DAG’ов в вашем Airflow переваливает за 800 и увеличивается на 10-20 DAG’ов в неделю? Согласен, звучит страшно, чувствуешь себя тем героем из Subway Surfers… А теперь представьте, что эта платформа является единой точкой входа для всех аналитиков из различных команд и DAG’и пишут более 50 различных специалистов. Подкосились ноги, холодный пот и желание уйти из IT?