IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python

     19.03.2024       Выпуск 536 (18.03.2024 - 24.03.2024)       Статьи

Основные типы распределений вероятностей в примерах

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения на сайте, нажатий на целевые кнопки, покупок товаров является обычным и необходимым явлением.

     17.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Сводка от pythonz net 10.03.2024 — 17.03.2024

А теперь о том, что происходило в последнее время на других ресурсах.

     16.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Краткий обзор токенизаторов: что это такое и зачем это надо?

Представьте себе, что вы читаете книгу и хотите найти все места, где упоминается слово «кот». Не знаю, зачем вам это, но пока остановимся на том, что вы это хотите. Вот очень надо.Так как это сделать?

     16.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Алгоритмы AdaBoost (SAMME & R2). Принцип работы и реализация с нуля на Python

Следующим мощным алгоритмом машинного обучения является AdaBoost (adaptive boosting), в основе которого лежит концепция бустинга, когда слабые базовые модели последовательно объединяются в одну сильную, исправляя ошибки предшественников.

     15.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Упорядочиваем закладки

У меня много статей в закладках. Многие из них я добавил, чтобы прочитать позже. Эта статья не про то, почему так произошло и как с этим бороться, а про то, как выбрать статью для удаления чтения. Давайте найдем самые лучшие статьи. Критериями могут быть, например, рейтинг, просмотры и т.д. И красиво оформим в виде HTML-файла.

     15.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Выжимаем из Random Forest максимум: увеличиваем полноту при 100% точности

Была классическая задача: по табличным данным предсказать некое событие — случится или нет. И как бы я к этим данным ни подбирался, с какого ракурса ни смотрел, результат, увы, не впечатлял. Данных было мало, а то, что было, обладало слабой предсказательной силой. Хотя казалось, что что-то вытащить все-таки можно.

 

     14.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Градиентный бустинг. Реализация с нуля на Python и разбор особенностей его модификаций (XGBoost, CatBoost, LightGBM)

На сегодняшний день градиентный бустинг (gradient boosting machine) является одним из основных production-решений при работе с табличными, неоднородными данными, поскольку обладает высокой производительностью и точностью, а если быть точнее, то его модификации, речь о которых пойдёт чуть позже.

     13.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Wunjo AI - дипфейки, клонирование речи

Сегодня мы рассмотрим проект с открытым исходным кодом, позволяющий создавать дипфейки, клонировать речь, генерировать видео, удалять текст и объекты, а также получать изображения без фона, прямо на вашем компьютере. Поговорим о Wunjo AI и его возможностях для тех, кто еще не в курсе.

     13.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Пишем чат-бот для работы с PDF

Задумывались вы над тем, чтобы задавать вопросы непосредственно из своих документов, хранящихся в облаке? Сохраните своё время, которое уходило бы на поиски и ручной мониторинг сайтов, и задействуйте автоматизацию при работе с PDF-документами. Если вас занимает такая перспектива, эта статья окажется для вас ценным ресурсом.

     12.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Ограничения в телеграм-бот (Bot API), о которых никто не расскажет

В декабре 23-го мне поступила творческая задача разработать телеграм-бот для проведения новогоднего марафона-тренинга по личностному росту. В этой статье расскажу о проблеме, с которой столкнулась при разработке телеграм-бота. Разберем ошибку 429 (Too Many Requests) и лимиты на доступ к API.

     12.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Стекинг и блендинг в ML. Ключевые особенности и реализация с нуля на Python

Среди всех методов ансамблирования особое внимание заслуживают две очень мощные техники, известные как стекинг (stacked generalization) и блендинг, особенность которых заключается в возможности использования прогнозов не только однородных, но и сразу нескольких разных по природе алгоритмов в качестве обучающих данных для другой модели, на которой будет сделан итоговый прогноз.

     11.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Создание генетического алгоритма для нейросети и нейроcети для графических игр с помощью Python и NumPy

Сегодня я расскажу и покажу, как сделать Genetic Algorithm(GA) для нейросети, чтобы с помощью него она смогла проходить разные игры. Я его испробовал на игре Pong и Flappy bird. Он себя показал очень хорошо.

     11.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Разбираемся в АА-деревьях (Python)

АА-дерево - это модификация красно-черного дерева с целью упрощения реализацииКак его реализовать и как оно работает на конкретных примерах

     11.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Разработка Desktop приложений на Python и библиотеки PySide6/PyQt6. Часть 2. Знакомство с виджетами и Qt Designer

Мы продолжаем изучать PySide6/PyQt6 и сейчас мы с Вами познакомимся с виджетами, компоновкой и Qt Designer. PySide6 включают в себя довольно большое количество встроенных виджетов. Вы можете найти более подробную информацию в официальной документации PySide6.

     11.03.2024       Выпуск 535 (11.03.2024 - 17.03.2024)       Статьи

Сводка от pythonz net 03.03.2024 — 10.03.2024

А теперь о том, что происходило в последнее время на других ресурсах.

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

await anywhere, взгляд на третью сторону медали: sync vs async vs …

Сегодня я расскажу как одно из наших решений сделало свой последний вздох, что привело к небольшому факапу, и о том как большое исследование помогло выиграть нам время и избежать ещё большего факапа — или нет?

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python

Кластеризация — это набор методов без учителя для группировки данных по определённым критериям в так называемые кластеры, что позволяет выявлять сходства и различия между объектами, а также упрощать их анализ и визуализацию. Из-за частичного сходства в постановке задач с классификацией кластеризацию ещё называют unsupervised classification.

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Разработка Desktop приложений на Python и библиотеки PySide6/PyQt6. Часть 1. Установка и первое приложение на PySide6

Сегодня мы с Вами рассмотрим прекрасную библиотеку PySide6, которая является оберткой для взаимодействия с Qt при помощи языка Python, которые позволяет вам использовать Python для написания desktop-приложений Qt.

     10.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Метод главных компонент (PCA). Принцип работы и реализация с нуля на Python

Метод главных компонент (Principal Component Analysis или же PCA) — алгоритм обучения без учителя, используемый для понижения размерности и выявления наиболее информативных признаков в данных. Его суть заключается в предположении о линейности отношений данных и их проекции на подпространство ортогональных векторов, в которых дисперсия будет максимальной.

     08.03.2024       Выпуск 534 (04.03.2024 - 10.03.2024)       Статьи

Как за один pet-проект получить два диплома

Все же знают серию компьютерных футбольных симуляторов FIFA? Раньше я много играл в эту игру. Кто-то скажет, что это бесполезная трата времени, но я с этим не согласен. Эта игра вдохновила меня на разработку pet-проекта, который стал моим бакалаврским дипломом.Во время игры в FIFA пользователь видит небольшую карту с местоположением игроков и мяча на поле, данный элемент интерфейса является очень полезной фичей, без которой невозможно представить полноценный игровой процесс. Мне показалось, что данную карту было бы неплохо перенести в реальный мир, используя видеозапись матча и нейросеть.