IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     19.03.2024       Статьи

Предварительная обработка данных для машинного обучения

В данной статье рассмотрим пример предобработки данных для дальнейшего исследования, например, использование метода кластеризации. Но для начала проясним, что из себя представляет машинное обучение и из каких этапов оно состоит.

     19.03.2024       Статьи

Классификация экзопланет (часть I обработка данных)

В машинном обучении есть один неоспоримый плюс- возможность заниматься чем угодно, если об это 'что угодно', есть данные. В данной статье мы обработаем данные с орбитального телескопа Kepler, сделаем отбор признаков и построим ml модель для классификации экзопланет. Это первая часть статьи с этими данным.

     19.03.2024       Статьи

Основные типы распределений вероятностей в примерах

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения на сайте, нажатий на целевые кнопки, покупок товаров является обычным и необходимым явлением.

     17.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Сводка от pythonz net 10.03.2024 — 17.03.2024

А теперь о том, что происходило в последнее время на других ресурсах.

     16.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Релизы
     16.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Краткий обзор токенизаторов: что это такое и зачем это надо?

Представьте себе, что вы читаете книгу и хотите найти все места, где упоминается слово «кот». Не знаю, зачем вам это, но пока остановимся на том, что вы это хотите. Вот очень надо.Так как это сделать?

     16.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Алгоритмы AdaBoost (SAMME & R2). Принцип работы и реализация с нуля на Python

Следующим мощным алгоритмом машинного обучения является AdaBoost (adaptive boosting), в основе которого лежит концепция бустинга, когда слабые базовые модели последовательно объединяются в одну сильную, исправляя ошибки предшественников.

     15.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Упорядочиваем закладки

У меня много статей в закладках. Многие из них я добавил, чтобы прочитать позже. Эта статья не про то, почему так произошло и как с этим бороться, а про то, как выбрать статью для удаления чтения. Давайте найдем самые лучшие статьи. Критериями могут быть, например, рейтинг, просмотры и т.д. И красиво оформим в виде HTML-файла.

     15.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Выжимаем из Random Forest максимум: увеличиваем полноту при 100% точности

Была классическая задача: по табличным данным предсказать некое событие — случится или нет. И как бы я к этим данным ни подбирался, с какого ракурса ни смотрел, результат, увы, не впечатлял. Данных было мало, а то, что было, обладало слабой предсказательной силой. Хотя казалось, что что-то вытащить все-таки можно.

 

     14.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Градиентный бустинг. Реализация с нуля на Python и разбор особенностей его модификаций (XGBoost, CatBoost, LightGBM)

На сегодняшний день градиентный бустинг (gradient boosting machine) является одним из основных production-решений при работе с табличными, неоднородными данными, поскольку обладает высокой производительностью и точностью, а если быть точнее, то его модификации, речь о которых пойдёт чуть позже.

     14.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи
     13.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Wunjo AI - дипфейки, клонирование речи

Сегодня мы рассмотрим проект с открытым исходным кодом, позволяющий создавать дипфейки, клонировать речь, генерировать видео, удалять текст и объекты, а также получать изображения без фона, прямо на вашем компьютере. Поговорим о Wunjo AI и его возможностях для тех, кто еще не в курсе.

     15.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Релизы

coverage - 7.4.4

Утилита позволяющая измерить процент покрытия тестами. Скачать можно по ссылке: https://pypi.python.org/pypi/coverage/

     13.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Видео

Практическая сторона тестов

Поделюсь личным опытом болей и радостей жизни с тестами и без. Обсудим лучшие и худшие практики. Покурим вместе код.