IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     02.11.2022       Выпуск 463 (31.10.2022 - 06.11.2022)       Статьи

Как мы строили самую большую модель кредитного скоринга в сегменте МСБ

Рано или поздно у любого банка появляется желание выдавать кредиты: максимально быстро, эффективно и с контролируемыми рисками. Для этой задачи нужна развитая система риск-менеджмента и как важная часть системы — модель кредитного скоринга. В статье речь пойдет о том, как это всё устроено в Точке.

     31.10.2022       Выпуск 463 (31.10.2022 - 06.11.2022)       Статьи

Топ-30 онлайн-ресурсов для обучения детей основам программирования на Python

Владение языком Python станет прекрасным активом будущего программиста. Если ваш ребенок увлекается программированием, то процесс обучения можно разнообразить с помощью полезных видео, обучающих игр, вступления в тематические сообщества и многого другого. В этой статье мы собрали полезные ресурсы по Python и поделили их по категориям.

     31.10.2022       Выпуск 463 (31.10.2022 - 06.11.2022)       Статьи

Как компьютерное зрение помогает определить координаты спутниковых снимков

В этой статье расскажу о том, как я занял второе место в конкурсе «Цифровой прорыв» с решением по автоматизации привязки фотографии к географическому положению. Главный инсайт — базовые решения не всегда хороши и проверены. Спойлер — самодеятельность и использование современных подходов помогают победить :) Расскажу на своем опыте, как не сделать свое решение хуже базового и проанализирую подходы других участников.

     31.10.2022       Выпуск 463 (31.10.2022 - 06.11.2022)       Статьи

Небанальные правила чистого Python. Часть 1

Большинство питонистов не раз слышали о таких правилах как «функции должны быть глаголами» или «не наследуйтесь явно от object в Python 3». В этой статье мы рассмотрим не такие банальные, но полезные правила чистого кода в Python.

     31.10.2022       Выпуск 463 (31.10.2022 - 06.11.2022)       Статьи

Как собирать статистику по pytest-прогонам в Test IT

Как известно, основной проблемой в тестировании является отчетность по прогонам. Некоторые компании собирают данные в отдельном хранилище. Вместо того, чтобы вручную организовывать хранение, было решено сохранять их в Test IT. Такие данные как: исход, время выполнения и количество автоматизированных кейсов позволяют разделить тесты на выборки и дать оценку покрытия автотестами.

     31.10.2022       Выпуск 463 (31.10.2022 - 06.11.2022)       Статьи

Multiple Instance Learning (MIL) для классификации наборов гистологических изображений со светлоклеточным раком почки

С учётом актуальности Multiple Instance Learning (далее: MIL) и, в частности, наличия преимуществ данного метода для анализа гистологических изображений, решил попробовать обучить модели с целью классификации наборов данных, на те, которые содержат только нормальные ткани и те, в которых встречаются изображения со светлоклеточным раком почки.

     30.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Что делать, если твой временной ряд растёт вширь

Есть мнение, что прогнозирование временных рядов - сложная задача. Но не будем расстраиваться, ведь есть и плюсы - существует ещё большое количество задач, когда рядов сразу несколько, и такие задачи ещё сложнее! Когда начинаем сравнивать, понимаем, что прогнозировать одномерные временные ряды не так уж и сложно. А вот что делать с ситуацией, когда временной ряд обрастает параллельно идущими с ним последовательностями других параметров (многомерный ряд), какие методы и алгоритмы использовать, и что делать, если задача прогнозировать такие ряды есть, а опыта не очень много (спойлер - используйте AutoML, а пока он работает восполните пробел прочитав пару статей по теме).

     29.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Ищем значение числа Пи используя генератор случайных значений

Представьте, что у вас есть функция random(), которая генерируют случайным образом значения в промежутке от 0 до 1. Вычислите значение числа Пи.
Это задачка с реального собеседования, будем разбираться! Читать далее

     28.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Создание 3D-сетки из изображения с помощью Python

Несколько лет назад генерация 3D-сетки из единственного двумерного изображения была сложной задачей. Но сегодня благодаря продвижению глубокого обучения разработано множество монокулярных моделей оценки глубины, дающих точную оценку карты глубины изображения. С помощью этой карты, выполнив реконструкцию поверхности, можно создать сетку.

     28.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Как мы “побеждали” в хакатоне по машинному обучению Data Product Hack

В статье я поделюсь опытом, как нам удалось всего за 5 дней собрать команду, придумать идею проекта, создать с нуля работающий прототип продукта, который решает реальную проблему на данных, и параллельно с этим посетить 12 встреч с ML-экспертами из ведущих AI компаний. Надеюсь, мой опыт поможет тебе подготовиться к твоему первому хакатону!

     27.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

От джуна до тимлида. Должен ли тимлид писать хороший код, чем хорош planning poker и другие интересности

Когда-то Юрий Орлов решил перейти из врачей в программисты. В 2018 году он устроился в Genix джуном, а сейчас он — тимлид VK Group. Начало истории вы можете послушать здесь, а в статье мы обсудим перипетии тимлидства — как опыт работы врачом помогает находить общий язык с людьми, должен ли тимлид писать код лучше членов команды, как работает Planning poker и что самое сложное в задачах тимлида.

     27.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Книга «Создание приложений машинного обучения: от идеи к продукту»

Освойте ключевые навыки проектирования, разработки и развертывания приложений на базе машинного обучения (МО)!

Пошаговое руководство по созданию МО-приложений с упором на практику: для специалистов по обработке данных, разработчиков программного обеспечения и продакт-менеджеров.
Читая эту книгу, вы шаг за шагом создадите реальное практическое приложение — от идеи до внедрения. В вашем распоряжении примеры кодов, иллюстрации, скриншоты и интервью с ведущими специалистами отрасли.

     27.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Как автоматизировать рутинные операции с помощью Jupyter, Python и Selenium

Сегодня я расскажу о нашем опыте создания робота для автоматизации повторяющихся действий сотрудников с помощью Jupyter, Python и Selenium. Статья будет интересна прежде всего менеджерам, которые хотят оптимизировать свою работу. Разработчикам мой текст будет полезен с точки зрения понимания возможностей по ускорению повторяющихся действий в интерфейсах. Весь необходимый код – внутри.

     26.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Бот для определения болезней собак. Улучшаем систему опроса

Несколько месяцев назад я написал статью про бота определяющего болезни кошек. За это время я сделал несколько улучшений и создал еще одного бота, но уже для собак. Ссылка на бота для кошек Бот для определения болезни кошек / Хабр (habr.com)

Бот может по симптомам определить болезнь собаки. Всего в списке есть 32 болезни. Это и заболевания внутренних органов, и опорно-двигательной системы и так же банальная чумка и бешенство.

     26.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

#3 Нейронные сети для начинающих. Работа с изображениями в OpenCV. Алгоритм Canny Edge Detector

Сегодня я хочу представить вам третью статью из серии «Нейронные сети для начинающих». Мы научимся обрабатывать изображения и сохранять результаты в отдельные файлы.

     26.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Squish для QT глазами разработчика

Squish - это платный инструмент для автоматического тестирования пользовательского интерфейса. Есть Squish для Qt, Squish для Windows, для веба, для Java и iOS.

Во всех случаях тестовые сценарии - это скрипты на питоне или других скриптовых языках.

Далее речь пойдет только про Squish для Qt и про питон.

Squish не требует модифицировать или перестраивать тестируемое приложение. Он встраивается в работающий процесс на этапе выполнения. Однако, возможность изменения кода все же пригодится, чтобы присвоить объектам имена, которые будут использоваться в тестовом скрипте.

     26.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Регрессионный анализ в DataScience. Часть 2. Преобразование Бокса-Кокса. Проверка тренда и случайности

В предыдущем обзоре мы рассмотрели простую линейную регрессию (simple linear regression) - самый простой, стереотипный случай, когда исходные данные подчиняются нормальному закону, имеется сильная линейная корреляционная связь между показателями, отсутствует гетероскедастичность.

     25.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Postgres WASM от Snaplet и Supabase

Сегодня мы с нашими друзьями из Snaplet открываем исходники postgres-wasm — запускаемый в браузере сервер PostgreSQL с полным набором функционала, включая сохранение состояния в браузере, восстановление из pg_dump и логическую репликацию из удалённой базы данных. Впервые Postgres в браузере запустили в Crunchy Data, их потрясающая версия выложена на HN месяц назад. Вместе со Snaplet мы решили сделать версию с открытым кодом.

     25.10.2022       Выпуск 462 (24.10.2022 - 30.10.2022)       Статьи

Практическая обработка изображения линии горизонта с помощью Python

Краткое руководство по профилированию линии горизонта городской панорамы с помощью Python в несколько строк кода.