IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     19.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Telegram WebApps. Как встроить веб-приложения в чат-бота?

Относительно недавно команда Telegram выпустила обновление, с которым появилась возможность встраивать в мессенджер веб-приложения. Эта статья — обзор основных моментов внедрения веб-приложениий в телеграм-ботов.

     19.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Проверка корректности А/Б тестов

Сегодня поговорим о том, что такое корректность статистических критериев в контексте А/Б тестирования. Узнаем, как проверить, является критерий корректным или нет. Разберём пример, в котором тест Стьюдента не работает.

     19.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Как создать пользовательский трансформер данных с помощью sklearn?

В процессе очистки и подготовки данных нам часто приходится делать такие простые операции, как удаление столбцов и пр. Зачем для этого каждый раз писать пользовательский код? sklearn предоставляет механизм стандартизации таких преобразований для любых данных и поможет нам создать унифицированный конвейер из нужных действий.

     19.12.2022       Выпуск 470 (19.12.2022 - 25.12.2022)       Статьи

Сегментация пожаров по спутниковым снимкам с помощью глубокого обучения и OpenVINO

Использование моделей глубокого обучения для решения задачи семантической сегментации (задачи присвоения метки принадлежности к некоторому классу для каждого из пикселей изображения) стало широко используемой практикой в различных областях: в медицине для анализа рентгеновских снимков и данных компьютерной томографии [1], в анализе видео с видеорегистраторов [2], управлении роботизированными манипуляторами [3]. Развивающейся является тематика использования моделей глубокого обучения для сегментации спутниковых данных [4].

     18.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Генерируем музыку с помощью Stable Diffusion

Многие уже слышали, а может и пробовали модель Stable Diffusion для генерации картинок из текста. Но знаете ли вы, как с помощью той же модели можно генерировать аудио?

     18.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Миллион записей для змеи

У меня есть небольшое хобби - я экспериментирую с машинным обучением применительно к торговле на бирже, в частности, с криптовалютами. После различных наколенных экспериментов я захотел создать удобный инструмент - базу торговых котировок. В процессе работы необходима быстрая загрузка достаточно большого количества данных. Это необходимо для расчетов, генерации данных для обучения, бэк-тестинга и других задач. Количество записей, которые нужно загрузить в питон довольно велико - речь может идти о миллионах и более записей.

     17.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

gRPC — альтернатива REST API от Google

Когда мы разрабатываем приложение, которое разделено на независимые автономные компоненты, мы говорим о микросервисной архитектуре. Для взаимодействия компонентов используется API. Самый популярным API является REST. Это обусловлено его гибкостью, эффективностью (в большинстве сценариев) и тем, что он легко масштабируется. 

     17.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

«Чтение — всему голова!» Переводим электронные книги формата .EPUB с помощью Python

Разберёмся что “под капотом” формата EPUB и как перевести текст, но не переводить код в книге. Познакомимся с библиотекой Ebook Lib, а также узнаем для чего нам понадобиться библиотека Beautiful Soup.

     16.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Автоматизируем Telegram-канал с AWS Lambda и DynamoDB

В этом материале вы узнаете, как создать Telegram-канал, который будет сам обновляться, получая данные из открытых источников. Используем Python, AWS Lambda, DynamoDB и BeautifulSoup.

     16.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Веб-автоматизация: не используйте Selenium, используйте Playwright

Для веб-автоматизации/тестирования Selenium всегда был стандартом де-факто. С ним легко начать работу, и он поддерживает практически все языки программирования.

     15.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Обучаем SVTR-Tiny для распознавания текста сцены

Сегодня мы расскажем вам, как дообучить новую state-of-the-art модель SVTR-Tiny для распознавания текста сцены (текста в реальных уличных условиях) на собственноручно сгенерированных изображениях с помощью API библиотеки PaddleOCR.

     15.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Автоматизируем перевод с деплоя bash-скриптами на helmfile при помощи Python: инструкция по применению

Максим Дубакин рассказал о рабочем проекте собственного производства, который заавтоматизировал повторяющиеся задачи по переводу с деплоя bash-скриптами на helmfile при помощи Python и уменьшил затраты времени на ~ 2 часа.

     14.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Поиск оптимильных маршрутов для перевозки самокатов

С 1 по 7 ноября проходила квалификация Yandex Cup 2022. В секции Алгоритм: Марафон организаторы предложили интересную задачу программирования в ограничениях, обобщения известной задачи коммивояжёра, задачу поиска маршрута (vehicle routing problem). В статье расскажу о своем решении на основе Google OR-tools.

     14.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Локализуем игру в слова с искусственным интеллектом

Даже на русском языке игра не самая простая Все началось с коллеги, который закинул в локальный чат сообщение, что он сыграл в игру #59 и угадал слово с 33 попыток и одной подсказки. Игра оказалась простая и сложная одновременно: сайт загадал слово и нужно его отгадать. В поле ввода отправляешь слово, а искусственный интеллект на сайте определяет, насколько отправленное слово близко по смыслу к загаданному. Интересная игра, тренирующая ассоциативное мышление и умение строить связи. Новое слово появляется каждый день, что в некотором смысле выглядит ограничителем. Также игра доступна только на португальском и английском языках. С одной стороны, это дополнительная практика, а с другой — сомнения «а знаю ли я это слово?» смазывают впечатления от игры. Так я задумался о локализации игры на русский язык.

     14.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Создаем интерпретатор Python на основе ChatGPT

Вдохновившись постом Building A Virtual Machine inside ChatGPT , я решил попробовать что-то подобное, но на этот раз вместо инструмента командной строки Linux давайте попробуем превратить ChatGPT в интерпретатор Python!

     14.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

ChatGPT пройдёт собеседование по Data Science вместо вас

Возможно, ты сейчас готовишься к собеседованию в какую-нибудь IT-компанию. Скорее всего, тебе будут задавать технические вопросы, поэтому тебе приходится готовиться. Но, возможно, ты всё равно не сможешь ответить на все вопросы правильно. Как быть?! А слышал ли ты про новую умную chatGPT? А что, если я тебе скажу, что больше готовиться к собеседованиям так усердно не нужно! Что?! Задаваемые тебе вопросы можно делегировать chatGPT. В общем, нет времени объяснять, давай устроим собес для chatGPT по Data Science и узнаем, сможет ли сетка его пройти?! Всё по классике — спрашиваем вопросы по 4 секциям: программирование — Python и алгоритмы, написание SQL-запросов, Data Science и статистика, ML System Design

     13.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Распознавание цифр, для максимально маленьких (python/keras)

Этот пост я решил написать, для тех, кто также искал понятный код и рабочий пример, который можно было взять, вставить в гугл колаб(google colab) и сразу начать "играться" с кодом. Но не нашел. Для вас, друзья!P.S весь код будет в конце.

     13.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Локализация Qt-приложений

В этой статье я хочу затронуть вопрос интернационализации Qt-приложений, поделиться своим опытом, показать легкость работы с предоставленными инструментами и некоторые неочевидные моменты, которые могут возникнуть...

     12.12.2022       Выпуск 469 (12.12.2022 - 18.12.2022)       Статьи

Как из данных узнавать о том, что в продукте что-то пошло не по плану

Расскажу, как мы ищем поведенческие аномалии в продукте и зачем это вообще нужно делать. Что такое аномалии?

     12.12.2022       Выпуск 468 (05.12.2022 - 11.12.2022)       Статьи

Изменения в Python 3.11

Эпопея завершилась и Python 3.11 вышел в релиз. Предлагаем заварить чайку и похоливарить на тему стилей, принципов и нотаций именования переменных.