IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     15.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Упорядочиваем закладки

У меня много статей в закладках. Многие из них я добавил, чтобы прочитать позже. Эта статья не про то, почему так произошло и как с этим бороться, а про то, как выбрать статью для удаления чтения. Давайте найдем самые лучшие статьи. Критериями могут быть, например, рейтинг, просмотры и т.д. И красиво оформим в виде HTML-файла.

     15.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Выжимаем из Random Forest максимум: увеличиваем полноту при 100% точности

Была классическая задача: по табличным данным предсказать некое событие — случится или нет. И как бы я к этим данным ни подбирался, с какого ракурса ни смотрел, результат, увы, не впечатлял. Данных было мало, а то, что было, обладало слабой предсказательной силой. Хотя казалось, что что-то вытащить все-таки можно.

 

     14.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Градиентный бустинг. Реализация с нуля на Python и разбор особенностей его модификаций (XGBoost, CatBoost, LightGBM)

На сегодняшний день градиентный бустинг (gradient boosting machine) является одним из основных production-решений при работе с табличными, неоднородными данными, поскольку обладает высокой производительностью и точностью, а если быть точнее, то его модификации, речь о которых пойдёт чуть позже.

     13.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Wunjo AI - дипфейки, клонирование речи

Сегодня мы рассмотрим проект с открытым исходным кодом, позволяющий создавать дипфейки, клонировать речь, генерировать видео, удалять текст и объекты, а также получать изображения без фона, прямо на вашем компьютере. Поговорим о Wunjo AI и его возможностях для тех, кто еще не в курсе.

     13.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Видео

Практическая сторона тестов

Поделюсь личным опытом болей и радостей жизни с тестами и без. Обсудим лучшие и худшие практики. Покурим вместе код.

     13.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Видео

Переход от Statsd к Prometheus

Про то, как структурировать метрики прометея в коде, выстроить удобные абстракции. Как меняется парадигма при переходе со statsd на прометей. Подводные камни при работе с прометеем.

     13.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Пишем чат-бот для работы с PDF

Задумывались вы над тем, чтобы задавать вопросы непосредственно из своих документов, хранящихся в облаке? Сохраните своё время, которое уходило бы на поиски и ручной мониторинг сайтов, и задействуйте автоматизацию при работе с PDF-документами. Если вас занимает такая перспектива, эта статья окажется для вас ценным ресурсом.

     12.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Ограничения в телеграм-бот (Bot API), о которых никто не расскажет

В декабре 23-го мне поступила творческая задача разработать телеграм-бот для проведения новогоднего марафона-тренинга по личностному росту. В этой статье расскажу о проблеме, с которой столкнулась при разработке телеграм-бота. Разберем ошибку 429 (Too Many Requests) и лимиты на доступ к API.

     12.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Стекинг и блендинг в ML. Ключевые особенности и реализация с нуля на Python

Среди всех методов ансамблирования особое внимание заслуживают две очень мощные техники, известные как стекинг (stacked generalization) и блендинг, особенность которых заключается в возможности использования прогнозов не только однородных, но и сразу нескольких разных по природе алгоритмов в качестве обучающих данных для другой модели, на которой будет сделан итоговый прогноз.

     11.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Создание генетического алгоритма для нейросети и нейроcети для графических игр с помощью Python и NumPy

Сегодня я расскажу и покажу, как сделать Genetic Algorithm(GA) для нейросети, чтобы с помощью него она смогла проходить разные игры. Я его испробовал на игре Pong и Flappy bird. Он себя показал очень хорошо.

     11.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Разбираемся в АА-деревьях (Python)

АА-дерево - это модификация красно-черного дерева с целью упрощения реализацииКак его реализовать и как оно работает на конкретных примерах

     11.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Разработка Desktop приложений на Python и библиотеки PySide6/PyQt6. Часть 2. Знакомство с виджетами и Qt Designer

Мы продолжаем изучать PySide6/PyQt6 и сейчас мы с Вами познакомимся с виджетами, компоновкой и Qt Designer. PySide6 включают в себя довольно большое количество встроенных виджетов. Вы можете найти более подробную информацию в официальной документации PySide6.

     11.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Сводка от pythonz net 03.03.2024 — 10.03.2024

А теперь о том, что происходило в последнее время на других ресурсах.

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

await anywhere, взгляд на третью сторону медали: sync vs async vs …

Сегодня я расскажу как одно из наших решений сделало свой последний вздох, что привело к небольшому факапу, и о том как большое исследование помогло выиграть нам время и избежать ещё большего факапа — или нет?

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python

Кластеризация — это набор методов без учителя для группировки данных по определённым критериям в так называемые кластеры, что позволяет выявлять сходства и различия между объектами, а также упрощать их анализ и визуализацию. Из-за частичного сходства в постановке задач с классификацией кластеризацию ещё называют unsupervised classification.

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Разработка Desktop приложений на Python и библиотеки PySide6/PyQt6. Часть 1. Установка и первое приложение на PySide6

Сегодня мы с Вами рассмотрим прекрасную библиотеку PySide6, которая является оберткой для взаимодействия с Qt при помощи языка Python, которые позволяет вам использовать Python для написания desktop-приложений Qt.

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Метод главных компонент (PCA). Принцип работы и реализация с нуля на Python

Метод главных компонент (Principal Component Analysis или же PCA) — алгоритм обучения без учителя, используемый для понижения размерности и выявления наиболее информативных признаков в данных. Его суть заключается в предположении о линейности отношений данных и их проекции на подпространство ортогональных векторов, в которых дисперсия будет максимальной.

     08.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Как за один pet-проект получить два диплома

Все же знают серию компьютерных футбольных симуляторов FIFA? Раньше я много играл в эту игру. Кто-то скажет, что это бесполезная трата времени, но я с этим не согласен. Эта игра вдохновила меня на разработку pet-проекта, который стал моим бакалаврским дипломом.Во время игры в FIFA пользователь видит небольшую карту с местоположением игроков и мяча на поле, данный элемент интерфейса является очень полезной фичей, без которой невозможно представить полноценный игровой процесс. Мне показалось, что данную карту было бы неплохо перенести в реальный мир, используя видеозапись матча и нейросеть. 

     07.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Как расширить возможности стандартного Enum

А может всё-таки есть способ сделать такой Enum, используя стандартную библиотеку Python?! Под катом будем разбираться в существующих вариантах решения. 

     07.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Open Source в финансах. Проект Okama

В среде финтех проектов наблюдается интересный парадокс. С одной стороны, вряд ли можно найти область, куда приходит больше инвестиций. Поэтому именно в финтехе сосредоточены самые продвинутые технологии: блокчейн, искусственный интеллект, биг дата, ML и др. С другой стороны, именно в финансовой области наблюдается наименьшее количество хорошо развитых open-source проектов.