IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE

     07.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Учим ИИ чатбота слушать и говорить

Мне очень нравится концепция, когда можно расширить возможности восприятия для искусственного интеллекта. Сегодня формат чата самый понятный и популярный для взаимодействия с ИИ. Безусловно, общение только через чат греет мою интровертивную душу, взращенную на BBS'ках и рассказах о НашBOFH. Но, всё же, почему бы не сделать общение с ботами более "человечным", научить их слушать, слышать и говорить?

     07.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Как понять, что клиента пора реактивировать?

В идеальном мире мы точно знаем, в какой момент времени пользователю нужно напомнить о нашем продукте. Причём таким образом, чтобы он не отказался от наших услуг, а совершил бы новый платёж. Если мы будем излишне активными, отправляя всем нашим клиентам сообщения, то это может стать и раздражающим фактором, и оказаться недешёвым вариантом. Подходы, основанные на анализе вероятности оттока каждого клиента в отдельности — это, безусловно, отличные варианты, но они требуют времени и ресурсов на исследование и разработку.

     07.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Эластичный DAG или «гнём, где не гнулось»

DataFactory это большое количество разнообразных данных, которые использует бизнес чтобы делать всем хорошо. А мы, нашим департаментом, отвечаем за их своевременное наполнение, поддержание в жизнеспособном состоянии, доведение данных до требуемого состояния и регулярную полноценную доступность.

     07.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Релизы

Wunjo AI v1.5. Клонирование голоса, замена лица по фото, удаления объектов в видео

В этой статье вы погрузитесь в захватывающий мир новых возможностей для создания дипфейков и синтеза речи в Wunjo AI v1.5, проект полностью с открытым исходным кодом. Вы узнаете о последних фичах, которые позволяют помимо синтеза речи, теперь клонировать голос из аудиофайлов или даже в режиме реального времени, меняют лица на видео с использованием всего одной фотографии, удаляют объекты с видеороликов и значительно повышают качество дипфейков с помощью нейронных сетей для ретуширования.

     07.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Как сделать свою страницу в Django Admin с выразительной Hand Chart?

Мир покера – увлекательный и непредсказуемый. Волнение перед каждой раздачей, стратегические решения, анализ оппонентов – все это создавало уникальную атмосферу напряжения и интриги. Однажды я получил предложение поучаствовать в проекте связанным с покерной тематикой.

     07.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Способ залезть в «кишочки» операционной системы и Docker с помощью PostgreSQL

Если у вас возникала идея получить доступ к метрикам операционной системы и оборудования компьютера из PostgreSQL, то теперь у вас есть инструмент для этого. Я не претендую на его зрелость и готовность к эксплуатации. Это просто прототип, позволяющий получить результаты запросов из osquery в PostgreSQL в виде табличных данных/JSON. Дальше с которыми можете использовать все привычные средства этой базы данных.

     07.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Вопросы и обсуждения

Python Bytes: #351 A Python Empire (or MPIRE?)

Очередной выпуск англоязычного подкаста Python Bytes

     06.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Алгоритм Левита: между Дейкстре и Беллманом

Когда заходит речь о поиске кратчайшего пути между двумя вершинами выбор обычно падает на алгоритмы Дейкстры или Беллмана-Форда, однако есть ещё один алгоритм, который может сработать быстрее Беллмана, но не "сломается" на графах с отрицательными рёбрами.

     06.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Создание приложения для распознавания текста с изображений и аудиофайлов

Запись текста с фотографии листа или из аудиозаписи в текстовый файл, доступный для редактирования – довольно часто встречающаяся задача при работе в офисах или учёбы. Для распознавания текстов и аудио в платных сервисах и программах сегодня используются такие подходы, как машинное зрение и распознавание речи с использованием глубоких нейронных сетей.

     05.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Codeium и StarCoder: нейросети с автодополнением кода

В мире технологий происходит настоящая революция. На передовом фронте этой революции стоят нейронные сети — мощные и удивительные инструменты искусственного интеллекта, которые сегодня изменяют наше представление о возможностях компьютеров. Нейросети обрели невероятную популярность и применение в различных областях: от компьютерного зрения до естественного языка, и их влияние на общество и технологический прогресс становится все более заметным.

     05.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Автоматическая разметка данных

В задачах машинного обучения значительную часть времени занимает процесс подготовки данных. К этапу подготовки относятся: сбор, фильтрация, разметка и предобработка данных.В данной статье я буду рассматривать процесс автоматической разметки данных для задач компьютерного зрения.

     04.09.2023       Выпуск 507 (04.09.2023 - 10.09.2023)       Статьи

Создание telegram-ботов с интерактивным меню

Однажды меня попросили провести ревью и рефакторинг одного telegram-бота. Увидев файл размером 2000 строк, рассчитанный только на обработку разных меню я понял, что это требует унификации и общих подходов. Так родилась библиотека aiogram-dialog.

 

     03.09.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Шаг в астрофизику с помощью Python

Давным-давно, человечество поднимало взоры к небесам и задавало себе вопросы о природе вселенной. Сегодня астрофизика стала ключом к пониманию космических явлений. Мы исследуем черные дыры, изучаем движение планет и звёзд, разгадываем секреты галактик. Исследования космических явлений требуют огромных объемов данных и сложных вычислений. Здесь на помощь приходит компьютерное моделирование. Мы можем воссоздать Вселенную на экране монитора, создавать виртуальные звёзды и планеты, а затем изучать их поведение.

     02.09.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Таблица-справочник – генератор DAG? А что так можно было?

Таблица справочник, которая является медленно изменяющейся и также генерирует DAG.В статье рассказывается как можно хранить бизнес-метрики и собирать их через DAG.

     01.09.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Анализ и визуализация данных с помощью библиотеки Altair

Altair — это декларативная библиотека визуализации данных, разработанная на основе языка Vega и Vega-Lite. Она предоставляет высокоуровневый интерфейс для создания информативных и красочных графиков с минимальными усилиями. Основная философия Altair заключается в том, что пользователи должны описывать, что они хотят увидеть на графике, а не как это реализовать. Это делает код более читаемым и интуитивно понятным.

     01.09.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Видео

Построение собственной платформы PIVI

История создания платформы. Архитектурные и технические особенности. Опыт внедрения.

     31.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Генерация паспортных данных для обучения моделей

Для тренировки нейронных сетей необходимы датасеты с достаточным количеством тренировочных данных. Зачастую в рамках разработки ML‑модели, именно составление датасета, пригодного для её обучения, занимает большую часть времени и усилий. В случае, если датасет нельзя составить из реальных данных, прибегают к генерации синтетических данных. При разработке «распознавателя» паспортов без достаточного количества реальных образцов возникла необходимость генерации паспортных данных и соответствующих им изображений отдельных полей.

     30.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Анализ музыкальных предпочтений с использованием аудиоаналитики

Музыка, неотъемлемая часть человеческой культуры, всегда отражала дух времени. Однако с наступлением цифровой эры и быстрого развития технологий, музыкальная индустрия столкнулась с революцией, которая изменила не только способы создания и распространения музыки, но и сам способ, которым мы взаимодействуем с ней.

     30.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Книга «Python. Лучшие практики и инструменты. 4-е изд.»

Python — простой, но мощный язык, поэтому он используется в самых разных областях. Написать код на Python легко, но сделать его удобочитаемым и пригодным для повторного использования и сопровождения может оказаться проблемой. Четвертое издание этой книги дополнено лучшими практиками, полезными инструментами и стандартами, которые применяют профессиональные разработчики.

     30.08.2023       Выпуск 506 (28.08.2023 - 03.09.2023)       Статьи

Классификация грибов методами ML

Хочу поделиться с вами своим опытом анализа данных и машинного обучения на примере интересной и полезной задачи — классификации грибов на съедобные и ядовитые. А именно, в данной статье я расскажу о том, как обучал различные модели машинного обучения отличать съедобные грибы от несъедобных, с какими сложностями столкнулся в процессе и какие интересные наблюдения про грибы и ML открыл по пути.