IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     02.07.2024       Выпуск 551 (01.07.2024 - 07.07.2024)       Статьи

Графы в рекомендательных системах [часть 1]

Недавно я писал научную статью с AIRI по графовым рекомендательным системам. Это был мой первый практический опыт работы с этой технологией, поэтому пришлось углубиться в исследования и изучение доступных материалов. Я решил, что пока я разбираюсь в этой теме, было бы полезно поделиться своими находками с вами.

     01.07.2024       Выпуск 551 (01.07.2024 - 07.07.2024)       Статьи

PandasAI — кратно ускоряем работу аналитика данных в одну строчку

Ускоряем написание кода при работе с таблицами и библиотекой Pandas с помощью PandasAI в несколько раз за пару строк. Хитрецы уже используют ...

     01.07.2024       Выпуск 551 (01.07.2024 - 07.07.2024)       Статьи

systemD с 0 до 1: библия сисадмина

Что бы кто не говорил, systemD становится стандартом систем инициализацией в линуксе. И с 80% вероятностью все сервера будут с systemD. Не факт, конечно, есть и личные сервера, на которых может стоять хоть Gentoo, хоть Devuan, хоть NixOS.

     01.07.2024       Выпуск 551 (01.07.2024 - 07.07.2024)       Статьи

Визуализация данных: четыре простых способа быстро улучшить диаграмму

Для многих специальностей, будь то бизнес-аналитика, Data Science или геология и геофизика, эффективная визуализация данных вошла в число принципиально важных навыков. Наглядное представление информации, понятное и эстетически привлекательное, может подтолкнуть целевую аудиторию к определенным мыслям или действиям. Хотя на Python создано несколько библиотек визуализации данных, студенты, изучающие этот язык и аналитику данных, часто начинают с Matplotlib.

     30.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Сводка от pythonz net 23.06.2024 — 30.06.2024

А теперь о том, что происходило в последнее время на других ресурсах.

     28.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

«Midjourney на коленке, но теперь с S3». Как хранить генерации с промптами в объектном хранилище

Построить конвейерную ленту по генерации изображений не так сложно — мы доказали это в обзоре. Но как сохранить результаты?

     28.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Руководство по задачам, возникающим при использовании речевой аналитики Яндекс SpeechSense (Часть 2)

Если у вас имеется собственный контактный центр, задача найти упоминание чего-либо конкретного в большом количестве аудиозаписей возникает регулярно. Недавно я опубликовал статью о том, как настраивать это решение с нуля. Во второй части я хочу показать, какие решения мне пришлось разработать дополнительно для использования речевой аналитики Яндекс SpeechSense, какие дополнительные задачи при этом появились и как их решать.

     28.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Обнаружение вторжений с применением технологий машинного обучения. Часть 2

В первой части статьи я рассказала некоторые теоретические основы про системы обнаружения вторжений и использование машинного обучения при решении задач информационной безопасности. Также рассмотрела данные, которые будут использоваться, их анализ и предварительную подготовку. Во второй части я продолжу рассказывать о реализации системы обнаружения вторжений с применением машинного обучения и подробно рассмотрю обучение моделей, а также анализ их работы и выводы, исходя из полученных результатов.

     27.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Как создать Python-приложение, которое предупредит о приближении астероида

В статье я постарался показать, как объединить космос и технологии в одном приложении, которое через API оповестит пользователей по SMS о приближающемся к Земле астероиде.

     27.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Разделяй и запускай: делим тестовый стенд между департаментами

В настоящей статье делюсь опытом разработки и внедрения в процессы компании оптимизационного решения на базе математического программирования. Материал расширил исследовательскими элементами и локальным мини benchmark'ом.

     27.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Бот авторизаций в Telegram для корпоративных чатов

В статье мы с главным разработчиком нашего бота (спойлер: стажером команды, которая проявила инициативу и вызвалась заняться этой нетривиальной задачкой) рассказываем о своем опыте разработки в Telegram API на основе библиотек Telebot и Telethon. Еще объясним, как смогли обойти ограничение Telegram по выгрузке в 200 пользователей и настроили интеграцию с корпоративным LDAP-каталогом. Ну и куда без дашборда статистики активности Tg-каналов в Fine BI. В свое время нам не хватило прикладного DIY-материала, и мы проходили весь путь с граблями и шишками самостоятельно. Надеемся, что эта статья поможет кому-то из вас. А те, кто уже прошел этот путь, подскажут нам новые пути решения и возможности апгрейднуть наш сервис.

     01.07.2024       Выпуск 551 (01.07.2024 - 07.07.2024)       Статьи

Мега-Учебник Flask Глава 16: Полнотекстовый поиск (издание 2024)

Это шестнадцатая часть серии мега-учебников Flask, в которой я собираюсь добавить возможность полнотекстового поиска в Microblog.

     27.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Классификация комбинаторных объектов на примере латинских квадратов

Хочу поделиться некоторым опытом по написанию программ для перечисления комбинаторных объектов из заданного класса (в примере будут рассматриваться латинские квадраты, хотя на картинке, для зрелищности, показан латинский куб).

     26.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

SVG-виджеты для tcl/tk. Градиентная заливка и прозрачность. Часть II

Продолжим знакомство с svg-виджетами для tcl/tk. Напомним, что рассматриваемые примеры, сам пакет svgwidgets и интерпретаторы tcl/tk с необходимыми пакетами можно найти на github-е

     26.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Разработка фреймворка для автоматизации загрузок данных из источников: Case Study для металлургической компании

Аналитика данных и витрины аналитики — источники аналитической отчетности, на основе которой принимаются стратегические управленческие решения. Однако на рынке нет готовых фреймворков, которые полностью удовлетворяют потребности в извлечении данных.

 

     26.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

strtree — классификатор строк на основе регулярных выражений

Мы поговорим про задачу классификации строк с помощью автоматически определяемых паттернов, а в конце я предоставлю пример такой процедуры с кодом на Python. Пользоваться мы будем небольшой open-source библиотекой strtree.

     25.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Анимация доски Гальтона на Python и manim

Многие видели математические видео с канала 3blue1brown. Оригинальный стиль, отличные визуализации самых разных математических понятий. Как они были сделаны? Грант Сандерсон, автор канала 3blue1brown, написал специальную библиотеку на питоне, manim, для создания своих видео. Библиотека оказалась популярной, был сделан форк и сложилось сообщество для ее дальнейшего развития. Мне стало интересно и я захотел научиться делать похожие видео, для примера будет анимация доски Гальтона. Математика присутствует, анимация интересная, что из этого вышло - написано в статье.

     25.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Об ускорении некоторых тестов на нормальность из библиотеки SciPy

В моей публикации вас ждут: небольшой ликбез по теории вероятностей, развивающий её интуитивное и практическое понимание; детективная история о том, как решение дифференциального уравнения привело нас к двум важнейшим статистическим характеристикам выборочных последовательностей; ревизионизм в области проверки распределений на соответствие гауссовскому и объяснение пресловутого p-value с нуля за 5 минуты.

     25.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Обнаружение вторжений с применением технологий машинного обучения. Часть 1

Совсем недавно я провела несколько вебинаров на тему использования машинного обучения в сфере информационной безопасности и теперь хочу поделиться с вами данной тематикой в нескольких статьях.

     24.06.2024       Выпуск 550 (24.06.2024 - 30.06.2024)       Статьи

Дообучение модели GPT-2 (RUS) для генерации описаний заведений на основании названия, рубрики и оценки

В данной работе представлен процесс дообучения модели генерации текста на основе архитектуры GPT-2. Целью работы является демонстрация возможностей применения дообученной модели для генерации текстов, соответствующих определённым наименованиям заведений, рубрикам и оценкам, выставленных пользователями.