IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     10.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Tutorial: в gigachat появился function calling

Недавно в документации к API GigaChat появился раздел, посвящённый работе с функциями, аналогично тому, как это реализовано в ChatGPT. Идея заключается в том, что модели передаётся информация о доступных ей функциях, и в зависимости от запроса пользователя модель может обратиться к этим функциям и добавить их результат к промту для генерации ответа

     10.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Реализация взаимодействия с БД через Middleware в Telegram-ботах

Когда я начинал писать своих первых ботов с использованием базы данных, их код был очень плохим: он расходовал лишние ресурсы, а также была плохая архитектура проекта. Поэтому я хочу поделиться с вами своими знаниями, чтобы вы не наступали на те грабли, на которые наступал я. В проекте бота, который будет использован в качестве примера в данной статье, я использовал такие технологии, как aiogram, SQLAlchemy, alembic и Docker. В качестве СУБД выступает PostgreSQL

     10.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Интеграция Grist и Metabase

Мы построили DWH из Open-source продуктов. В этой статье расскажу, какие продукты мы используем, какие хитрости придумали для работы с ними как вся система работает вместе.

     08.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Разбор задач «Квеста на миллион»

Разбираем задачи прошедшего квеста на миллион. Для простоты, в разборе будем использовать формализованные формулировки задачи. Ознакомиться с исходными формулировками можно в самом квесте. Квест открыт и доступен для прохождения.

     08.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Python для анализа годовых температур в Москве

Давайте на примере анализа годовых температур в Москве разберемся как с его помощью можно выгрузить, предобработать и визуализировать данные новичку в этом деле.

     08.04.2024       Выпуск 539 (08.04.2024 - 14.04.2024)       Статьи

Мега-Учебник Flask Глава 3: Веб-формы (издание 2024)

В главе 2 я создал простой шаблон для домашней страницы приложения и использовал поддельные объекты в качестве заполнителей для того, чего у меня еще нет, например, пользователей и записей в блоге. В этой главе я собираюсь устранить одно из многих недостатков, которые у меня все еще есть в этом приложении, в частности, как принимать входные данные от пользователей через веб-формы.

     07.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Класс Reverse Mapping на Python

В процессе разработки часто приходится использовать словари для получения значения по ключу. Это отлично подходит для маппинга полей различных систем. Например, в одной системе тип документа "Договор", а в другой "Contract". Либо одна система принимает буквенный код валюты "RUB", а другая числовой "643". Для того чтобы они понимали друг друга, необходимо переводить значения в понятные для этой системы, и для этого прекрасно подходят словари.

     07.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Сказ о том, как я эмулятор Intel 4004 на Python писал (часть 2)

Это вторая часть о том, как я писал и продолжаю писать и улучшать эмулятор Intel 4004 с очень ограниченным функционалом на языке Python. В этот раз я решился переписать эмулятор с нуля, исправив довольно весомые ошибки предыдущего эмулятора..

     07.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Сводка от pythonz net 31.03.2024 — 07.04.2024

А теперь о том, что происходило в последнее время на других ресурсах.

     07.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Pandas: от хаоса к красоте кода

Работа с pandas.DataFrame может превратиться в неловкую кучу старого (не очень) доброго спагетти-кода. Я и мои коллеги часто используем эту библиотеку, и хотя мы стараемся придерживаться хороших практик программирования, таких как разделение кода на модули и модульное тестирование, иногда мы все равно мешаем друг другу, создавая запутанный код.

     05.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Как перезапускать PySpark-приложение и зачем это может понадобиться

Мы используем PySpark, который позволяет очень быстро распределённо обрабатывать данные в оперативной памяти узлов нашего кластера на базе Hadoop. Я поделюсь способом, с помощью которого можно снизить потребление ресурсов кластера за счёт перезапуска PySpark-приложений между выполняемыми Spark-задачами, и расскажу, как это делать правильно.

     05.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Универсальные типы в python

Универсальные типы в python являются незаменимым инструментом, который позволяет выявлять множество ошибок на моменте написания кода, а также делает код чище и элегантнее.

     04.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Синтетическое генерирование данных (SMOTE)

Почему несбалансированные данные — это большая проблема? К примеру у нас есть набор данных, где один класс значительно преобладает над другим. В такой ситуации наша ml моделька может просто "забить" на малочисленный класс, сосредоточившись на многочисленных классах. Это приводит к ситуации, когда модель хорошо работает на общем уровне, но плохо распознаёт важные исключения или редкие случаи.

     04.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Мониторинг Apache Airflow. Оценка «прожорливости» тасок

Случались ли у вас ситуации, когда количество DAG’ов в вашем Airflow переваливает за 800 и увеличивается на 10-20 DAG’ов в неделю? Согласен, звучит страшно, чувствуешь себя тем героем из Subway Surfers… А теперь представьте, что эта платформа является единой точкой входа для всех аналитиков из различных команд и DAG’и пишут более 50 различных специалистов. Подкосились ноги, холодный пот и желание уйти из IT?

     04.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Propensity score matching: как оценивать маркетинговые кампании, если невозможно провести A/B тесты

В этой статье я расскажу, как оценивать маркетинговые кампании, если провести A/B- тесты нельзя. Еще обсудим логику в Propensity Score Matching (PSM), и то, какую пользу инструмент может принести вашему бизнесу. А в конце статьи покажу, как достаточно просто можно развернуть такую штуку у себя.

     03.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Мега-Учебник Flask Глава 2: Шаблоны (издание 2024)

После завершения главы 1 у вас должно получиться простое, но функциональное веб-приложение. Во второй части серии мега-учебника по Flask я собираюсь обсудить, как работать с шаблонами.

     02.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Об одной изящной задаче

Имеется функция magic(), принимающая три целочисленных аргумента, в теле которой определены константы a, b, c, являющиеся натуральными числами. Требуется определить значения констант a, b и c за минимальное количество вызовов данной функции.

     02.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Модули multiprocessing и threading в Python

Данная статья написана новичком для новичков, т.е. для тех, кто только начинает изучать возможности многопроцессорного и многопоточного программирования в Python. Статья намеренно пишется без воды и со скомканной теорией, в стиле шпаргалки.

     02.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Django + React. Авторизация с помощью сессий между разными источниками

Сегодня будет рассмотрена авторизация с помощью сессий между Django и React, которые находятся на разных доменах, т.е случай "cross-origin". Я в двух словах донесу принцип работы, причины появления концепций и технологий описанных здесь, оставлю ссылки на более подробные источники и приведу код конкретной реализации с объяснением своих шагов.

     01.04.2024       Выпуск 538 (01.04.2024 - 07.04.2024)       Статьи

Максимизируем продуктивность: Создание ИИ-секретаря с Whisper и ChatGPT

В современном мире искусственный интеллект стал незаменимым помощником в различных сферах нашей жизни. Однако, я верю, что всегда нужно стремиться к большему, автоматизируя все процессы, которые возможно. В этой статье я поделюсь опытом использования Whisper и ChatGPT для создания ИИ‑секретаря, способного оптимизировать хранение и обработку корпоративных созвонов.