IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     27.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Алгоритм поиска самой длинной подстроки палиндрома

Один из самых прекрасных алгоритмов в информатике, который показывает, как можно получить большое ускорение от "вялого" O(n3) до молниеносного1 O(n), просто посмотрев на проблему с другой точки зрения.

     25.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Тематическое моделирование с использованием эмбеддингов BERT

Обработка естественного языка одно из востребованных направлений машинного обучения, которое постоянно развивается. В 2018 году компания Google представила новую модель - BERT, сделавшую прорыв в области обработки естественного языка. Несмотря на то, что сейчас у BERT много конкурентов, включая модификации классической модели (RoBERTa, DistilBERT и др.) так и совершенно новые (например, XLNet), BERT всё ещё остается в топе nlp-моделей.

     25.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Распознавание лиц на RASPBERRY PI

Биометрия везде. Современные мегаполисы в России и мире окутаны сетями камер, подключенными к различным системам распознавания лиц. Насколько это правильно с точки зрения этики — каждый решает сам, но факт в том, что такие методы не только помогают раскрывать преступления, но и предотвращать их совершение.

     25.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Почему я начал использовать аннотации типов в Python – и вам тоже советую

С появлением подсказок типов (type hints) в Python 3.5+ добавилась опциональная статическая типизация – поэтому эти подсказки так мне нравятся. Теперь я аннотирую ими все мои проекты.

     24.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

MoreliaTalk — безопасный мессенджер с открытым исходным кодом

Сегодня я хочу рассказать вам о проекте, над которым я и ещё несколько разработчиков трудимся уже полтора года. Этот проект называется MoreliaTalk. Что это же он из себя представляет? MoreliaTalk - это мессенджер с открытым исходным кодом, построенный на клиент-серверной архитектуре. Сервер и клиенты можно использовать как встраиваемое решение для быстрого развёртывания функционала современного чата в своём проекте, так и в личных целях. Сервер написан на языке Python, а клиенты используют разные технологии для охвата как можно большего количества платформ. Это если описывать кратко, не вдаваясь в детали. А детали будут дальше...

     24.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Об одной нерассмотренной возможности загрузки сознания, или что такое самообучающаяся анимация

Попыток "загрузить" сознание в компьютер известно великое множество, однако все они страдают хотя бы от одного из двух больших недостатков: невозможность выразить эмоции и субъективную составляющую психики; страшная дороговизна и ресурсоёмкость.

     23.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Тычем палкой в итераторы

Итераторы – мощные и очень полезные составляющие Python. Цель этой статьи в их изучении подручными инструментами. Сразу предупреждаю, что в исследовательском арсенале у меня не швейцарский нож, а палка-копалка. Как известно, она предназначена для разрыхления почвы, но для нескольких любопытных находок достаточно и этого.

     23.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Tcl/tk: интегрированная среда разработки TKproE-2.30

Прошло без малого пять лет как я впервые столкнулся с интегрированной средой разработки программ на tcl/tk TKproE-2.20. И вот апреле 2021 года вышла новая версия этого продукта — TKproE-2.30 и я полностью погрузился в её мир. Он меня заворожил. Название TKproE является аббревиатурой от TCL/TK Programming Environment. TKproE — это интегрированная среда разработки программ для языка сценариев TCL/TK. Сам TKproE полностью написан на языке TCL/TK. В преамбуле к TKproE подчёркнуто, что он поддерживает быструю разработку сложных графических пользовательских интерфейсов.

     22.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Кредитный скоринг. Сокрушающий эффект ИИ при оценке кредитоспособности заёмщика

На самом деле одним из важнейших факторов при принятии банком решения о выдаче кредита и условиях кредитного соглашения является оценка кредитоспособности потенциального заемщика, т. е. его способности полностью исполнить взятые на себя обязательства, своевременно погасив кредит и начисленные проценты.

     22.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

FastAPI, asyncio и multiprocessing

Недавно товарищ поделился со мной ссылкой на статью про FastAPI и кооперативную мультипоточность. В ней автор, во-первых, ссылается на исследование другого автора про сравнение производительности между синхронными и асинхронными Python фреймворками. А во-вторых, приводит личный пример падения производительности приложения и как итог значительного увеличение задержки ответов от сервера.

     22.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Как тестировать сайт на Django. Часть 2. JavaScript и русский текст на английских страницах

В прошлой статье мы познакомились с тестами для Django и создали личного пользователя-тестировщика. Самое время продолжить изучать тестирование сайта, написав проверку русских символов на английских страницах и разобрав тесты для JavaScript.

     21.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Прогнозирование качества извлечение оксида железа из руды с помощью машинного обучения

Данный проект я реализовал, чтобы показать насколько эффективно можно применять методы машинного обучения для оптимизации и улучшения металлургических процессов. Так что давайте я начну с маленькой теоретического введения.

     21.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

U-Net Image Segmentation in Keras

In this tutorial, you will learn how to create U-Net, an image segmentation model in TensorFlow 2 / Keras. We will first present a brief introduction on image segmentation, U-Net architecture, and then walk through the code implementation with a Colab notebook.

     21.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Объект, камера, монитор – что происходит с цветом?

В комментариях на статью "Калибровка и профилирование мониторов" был заметен некоторый скепсис относительно необходимости таких процедур как калибровка и профилирование монитора посредством достаточно сложных программных инструментов. Эта публикация была мной обещана в комментариях.

     21.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Неравный join

Задача объединения табличных представлений очень часто встречается как в аналитике, так и в разработке (БД). Существует несколько различных типов слияний, фактически, это операции над множествами. Не будем погружаться в детали, на эту тему написано множество книг, семинаров, публикаций. Посмотрим на эти механизмы в преломлении практических задач. Будем смотреть по нарастающей сложности и пытаться решить их на «офисном» ноутбуке, не привлекая бесконечные мощности больших данных или реляционные БД.

     21.02.2022       Выпуск 427 (21.02.2022 - 27.02.2022)       Статьи

Учим гипермодальный трансформер предсказывать калорийность борща

Сегодня мы поговорим о такой важной теме как мультимодальные трансформеры.

Что же это такое в контексте машинного обучения - это способность одной модели работать сразу с несколькими видами данных - текстом, картинками, звуком, вытаскивать из них фичи в единое векторное пространство и манипулировать контентом на входе и выходе. Эта идея появилась еще на заре трансформеров в статье One Model To Learn Them All

     19.02.2022       Выпуск 426 (14.02.2022 - 20.02.2022)       Статьи

Еще один способ развернуть python автотесты web-приложения на базе интеграции с QASE

В этой статье кратко расскажу о том, как при стечении нескольких положительных обстоятельств нам удалось быстро поднять систему автотестов для нашего web-приложения.

     19.02.2022       Выпуск 426 (14.02.2022 - 20.02.2022)       Статьи

Калибровка и профилирование мониторов

В этой статье автор делится тем, что узнал сам, когда заинтересовался темой о калибровке монитора и создании его цветового профиля в домашних условиях. Автор применил свои знания при создании программы предназначенной для визуальной калибровки монитора.

     18.02.2022       Выпуск 426 (14.02.2022 - 20.02.2022)       Статьи

gamio. Русскоязычное текстовое приключение с GPT2

Моя попытка создать аналог aidungeon, novelai, holo AI для русского языка. Хоть я и пытался сделать всё с абсолютного нуля, получилось не плохо.

В данном посте я затрону технические проблемы и расскажу про самые ранние попытки создать gamio.ru