IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     06.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Алгоритм Левита: между Дейкстре и Беллманом

Когда заходит речь о поиске кратчайшего пути между двумя вершинами выбор обычно падает на алгоритмы Дейкстры или Беллмана-Форда, однако есть ещё один алгоритм, который может сработать быстрее Беллмана, но не "сломается" на графах с отрицательными рёбрами.

     06.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Создание приложения для распознавания текста с изображений и аудиофайлов

Запись текста с фотографии листа или из аудиозаписи в текстовый файл, доступный для редактирования – довольно часто встречающаяся задача при работе в офисах или учёбы. Для распознавания текстов и аудио в платных сервисах и программах сегодня используются такие подходы, как машинное зрение и распознавание речи с использованием глубоких нейронных сетей.

     05.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Codeium и StarCoder: нейросети с автодополнением кода

В мире технологий происходит настоящая революция. На передовом фронте этой революции стоят нейронные сети — мощные и удивительные инструменты искусственного интеллекта, которые сегодня изменяют наше представление о возможностях компьютеров. Нейросети обрели невероятную популярность и применение в различных областях: от компьютерного зрения до естественного языка, и их влияние на общество и технологический прогресс становится все более заметным.

     05.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Автоматическая разметка данных

В задачах машинного обучения значительную часть времени занимает процесс подготовки данных. К этапу подготовки относятся: сбор, фильтрация, разметка и предобработка данных.В данной статье я буду рассматривать процесс автоматической разметки данных для задач компьютерного зрения.

     05.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи
     04.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Создание telegram-ботов с интерактивным меню

Однажды меня попросили провести ревью и рефакторинг одного telegram-бота. Увидев файл размером 2000 строк, рассчитанный только на обработку разных меню я понял, что это требует унификации и общих подходов. Так родилась библиотека aiogram-dialog.

 

     03.09.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Шаг в астрофизику с помощью Python

Давным-давно, человечество поднимало взоры к небесам и задавало себе вопросы о природе вселенной. Сегодня астрофизика стала ключом к пониманию космических явлений. Мы исследуем черные дыры, изучаем движение планет и звёзд, разгадываем секреты галактик. Исследования космических явлений требуют огромных объемов данных и сложных вычислений. Здесь на помощь приходит компьютерное моделирование. Мы можем воссоздать Вселенную на экране монитора, создавать виртуальные звёзды и планеты, а затем изучать их поведение.

     02.09.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Таблица-справочник – генератор DAG? А что так можно было?

Таблица справочник, которая является медленно изменяющейся и также генерирует DAG.В статье рассказывается как можно хранить бизнес-метрики и собирать их через DAG.

     01.09.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Анализ и визуализация данных с помощью библиотеки Altair

Altair — это декларативная библиотека визуализации данных, разработанная на основе языка Vega и Vega-Lite. Она предоставляет высокоуровневый интерфейс для создания информативных и красочных графиков с минимальными усилиями. Основная философия Altair заключается в том, что пользователи должны описывать, что они хотят увидеть на графике, а не как это реализовать. Это делает код более читаемым и интуитивно понятным.

     31.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Генерация паспортных данных для обучения моделей

Для тренировки нейронных сетей необходимы датасеты с достаточным количеством тренировочных данных. Зачастую в рамках разработки ML‑модели, именно составление датасета, пригодного для её обучения, занимает большую часть времени и усилий. В случае, если датасет нельзя составить из реальных данных, прибегают к генерации синтетических данных. При разработке «распознавателя» паспортов без достаточного количества реальных образцов возникла необходимость генерации паспортных данных и соответствующих им изображений отдельных полей.

     31.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

An Intro to Protocol Buffers

Protocol buffers are a data serialization format that is language agnostic.

     30.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Анализ музыкальных предпочтений с использованием аудиоаналитики

Музыка, неотъемлемая часть человеческой культуры, всегда отражала дух времени. Однако с наступлением цифровой эры и быстрого развития технологий, музыкальная индустрия столкнулась с революцией, которая изменила не только способы создания и распространения музыки, но и сам способ, которым мы взаимодействуем с ней.

     30.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Operator Overloading in Python

Python is an object-oriented programming language and one of its features is that it supports operator overloading, learn how to overload common operators such as addition, subtraction, comparison, and more.

     30.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Книга «Python. Лучшие практики и инструменты. 4-е изд.»

Python — простой, но мощный язык, поэтому он используется в самых разных областях. Написать код на Python легко, но сделать его удобочитаемым и пригодным для повторного использования и сопровождения может оказаться проблемой. Четвертое издание этой книги дополнено лучшими практиками, полезными инструментами и стандартами, которые применяют профессиональные разработчики.

     30.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Классификация грибов методами ML

Хочу поделиться с вами своим опытом анализа данных и машинного обучения на примере интересной и полезной задачи — классификации грибов на съедобные и ядовитые. А именно, в данной статье я расскажу о том, как обучал различные модели машинного обучения отличать съедобные грибы от несъедобных, с какими сложностями столкнулся в процессе и какие интересные наблюдения про грибы и ML открыл по пути.

     29.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Первые шаги в ML на обучающем хакатоне: обнаружение птиц на фотографиях yolov8s + sahi

Несколько месяцев я пытался разбираться в ML и когда мне под руку попался легенький хакатон для школьников, связанный с CV, я решил, что это мой шанс!Изучая задачу, я понял, что мне нужно обнаруживать чаек по фотографиям. Для решения задачи я решил использовать yolov8s, потому что он мне показался оптимальнейшим из линейки yolov8 для моего случая.

     29.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Знакомимся с RepkaPi.GPIO SysFS. Установка и управление GPIO через Python 3. Теоретические основы работы GPIO портов

Начнем знакомство с подключаемой библиотекой RepkaPi.GPIO, данная библиотека написана на Python 3 и для управления GPIO использует методы, реализованные через SysFS.

     28.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Использование конечных автоматов с несколькими активными состояниями для автоматизации бизнес-процессов

Производственная деятельность предприятия связана с работой ответственных должностных лиц над одним или несколькими документами. Порядок прохождения документов определён нормативными актами. Каждое должностное лицо заполняет ту или иную часть документа, согласовывает, утверждает документ, возвращает его на доработку, участвует в выполнении работ по документу.

     28.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Профилирование Python — почему и где тормозит ваш код

Представьте ситуацию: вы написали скрипт для обработки каких-то данных на ноутбуке, ушли попить кофе, а когда пятнадцать минут спустя вернулись, завершилось едва ли 10%. Почему скрипт работает так медленно? Какая его часть тормозит? Дело в чтении данных, их обработке или сохранении? Как ускорить исполнение?