IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     07.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Как я сделал полноценное приложение, не прикасаясь к JavaScript

Я всегда скептически относился к чат-ботам. Когда-то они были на хайпе. Говорили, что это новый UI – он же No UI. Но я всегда утверждал, что пользователю проще и быстрее все действия сделать через сайт, а не играть с ботом в вопрос-ответ. Каково же было моё удивление, когда через несколько лет я сам буду пропагандировать чат-ботов всем моим друзьям - backend-разработчикам? В данной статье расскажу, как я до этого дошел.

     07.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Как мы не смогли создать медицинского чат-бота. История проекта, который так и не увидел свет

В последние годы рынок телемедицины (дистанционных медицинских услуг) и в целом медтеха активно растет, и пандемия коронавируса только ускорила его развитие. Такие технологии востребованы, потому что они относительно дешевы, доступны вне зависимости от места проживания пациента и дают возможность самостоятельно выбирать врачей. 

     07.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Почему мы перешли с Python на Go

Поставщик высоконагруженного API Stream перешёл с Python на Go, хотя этот язык знают немногие.

     06.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Как работать с PyScript — фреймворком для фронтенда на Python

В веб-разработке Python используется в основном на бэкенде с такими фреймворками, как Django и Flask. А сегодня, к старту курса по Fullstack-разработке на Python, расскажем о PyScript, который даёт возможность запускать Python прямо в HTML.

     06.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Переписываем API тесты

Попробуем в несколько итераций написать API тесты на Python и рассмотрим типичные ошибки, с которыми можно столкнуться.

     06.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Как сделать свою рекомендательную систему: история одной дипломной работы

В этой статье расскажем, как команда выпускников курса «Мидл Python-разработчик» создала рекомендательную систему для онлайн-кинотеатра с нуля. Читать далее

     06.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Советы, которые могут спасти Вас от ужасов PyYAML

YAML - это широко используемый язык сериализации данных. Все разработчики сталкиваются с необходимостью обработать YAML время от времени. Но обработка YAML, особенно с использованием PyYAML в Python, мучительна и полна ловушек. Здесь изложены некоторые советы, которые могут облегчить Вашу жизнь с PyYAML.

     06.06.2022       Выпуск 442 (06.06.2022 - 12.06.2022)       Статьи

Еще раз о KISS и трендах

Последние несколько лет async вообще и asyncio в частности в питоне все больше набирают популярность и их все чаще используют. При этом иногда забывают о принципе KISS (Keep it simple, stupid) и о том, какие вообще проблемы решает асинхронный код и зачем он нужен. В этой статье я бы хотел описать пример, когда задачу можно и, на мой взгляд, нужно решать без использования async. И вообще, практически без всего.

     05.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Рейтинг русскоязычных энкодеров предложений

Энкодер предложений (sentence encoder) – это модель, которая сопоставляет коротким текстам векторы в многомерном пространстве, причём так, что у текстов, похожих по смыслу, и векторы тоже похожи. Обычно для этой цели используются нейросети, а полученные векторы называются эмбеддингами. Они полезны для кучи задач, например, few-shot классификации текстов, семантического поиска, или оценки качества перефразирования.

     05.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Poetry — менеджер пакетов для Python

Рассмотрим установку и использование инструмента для управления библиотеками и зависимостями в Python.

     03.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Как написать средство проверки орфографии кхмерского языка

В попытке реализовать проверку и исправление орфографии, я наткнулся на популярный метод, основанный на двух концепциях из области орфографии: редакционное расстояние (также известное как расстояние Левенштейна) и BK-дерево. Итак, обсудим эти концепции и их недостатки, а также поделимся разработанной на их основе реализацией средства проверки орфографии кхмерского языка на Python.

     03.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Pandas vs dask vs sqlite на raspberry pi

Возникла необходимость поработать с базой штрихкодов (barcode) на одноплатнике raspberry pi. Задача простая — открыть базу данных (~700 Мб), найти штрихкод и сделать это «достаточно быстро». Как оказалось, эти действия могут вылиться в захватывающее путешествие как в части того, как в базе быстро найти нужный код, так и в части того, как эту базу быстро открыть, чтобы найти. В работе помогали фреймворки pandas, dask, а также инструмент sqlite. Кто из них справился и какие есть нюансы — в данной статье.

     03.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

[recovery mode] Обзор на книгу «Секреты Python. 59 рекомендаций по написанию эффективного кода»

Публикую рецензию на книгу "Секреты Python. 59 рекомендаций по написанию эффективного кода" от автора Бретта Слаткина

     02.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Прокладываем тропинки до микросервисов

Одна из наиболее важных задач при разделении системы на микросервисы - обеспечить надежный механизм их репликации и обнаружения и создать набор правил для маршрутизации входящих запросов к соответствующим контейнерам или сетевым узлам. Идеальная система также должна уметь отслеживать состояние доступности и исключать недоступные реплики из маршрутизации. В этой статье мы поговорим об использовании маршрутизатора Kong, который принимает на себя не только задачи умной маршрутизации, но и возможности по протоколированию и трансформации запросов, контролю доступа, мониторингу запросов, а также может быть расширен с использованием плагинов.

     02.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Анализируем речь с помощью Python: Как и о чем говорят на YouTube-канале «вДудь»?

Выход практически каждого ролика на канале «вДудь» считается событием, а некоторые из этих релизов даже сопровождаются скандалами из-за неосторожных высказываний его гостей.Сегодня при помощи статистических подходов и алгоритмов ML мы будем анализировать прямую речь. В качестве данных используем интервью, которые журналист Юрий Дудь (признан иностранным агентом на территории РФ) берет для своего YouTube-канала. Посмотрим с помощью Python, о чем таком интересном говорили в интервью на канале «вДудь».

     02.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Как с помощью Python создать приложение для расшифровки речи в реальном времени

Научить ИИ разговаривать шёпотом — непростая задача даже сегодня. Но мы покажем, насколько простыми стали распознавание и транскрипция речи, по крайней мере, на поверхности.

     01.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Собираем генератор данных на Blender. Часть 2: Камера

В предыдущей статье мы рассмотрели работу с объектами на Blender. Но для того, чтобы создать минимально жизнеспособный генератор, нужно разобраться в том, как работают камеры.

     01.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Как ускорить Python с помощью C-расширений. Часть 2

Это вторая часть статьи, посвященной тому, как писать быстрый код на Python с использованием C-расширений. Я расскажу о всех нюансах и приведу конкретный пример применения этого метода.

     01.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Как я дообучал Tesseract и что из этого получилось

Решал я как-то задачку по поиску сущностей в отсканированных документах. Чтобы работать с текстом, надо его сначала получить из картинки, поэтому приходилось использовать OCR. Выбор пал на одну из самых популярных и доступных библиотек Tesseract. С ее помощью задача решается очень неплохо и процент распознавания текста достаточно высокий, особенно на хороших сканах. Но нет предела совершенству, а так же ввиду наличия большого количества документов сомнительного качества, по-улучшав пайплайн разными методами, было принято решение попробовать улучшить и сам тессеракт.

     01.06.2022       Выпуск 441 (30.05.2022 - 05.06.2022)       Статьи

Умная кухня

Любому руководителю важна информация, отражающая скорость и качество работы области, за которую он отвечает. В 2020 году мы в Х5 Tech начали поддерживать производство готовой еды Smart Kitchen («Фабрика кухни») и изучать его внутренние процессы. Оказалось, что руководители поздно получают важную для бизнес-процессов информацию. К примеру, отчёты о сроках отгрузки или списанных позициях IT-платформа считает лишь к середине или даже концу следующего дня.