IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Twitter

     18.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Простые лайфхаки для автоматизации работы с помощью Python

Если какое-то действие приходится выполнять слишком часто — значит, пора его автоматизировать.Разбираю полезные скрипты — от работы с файлами до DevOps. В каждом разделе есть примеры для новичков и более опытных разработчиков. А в конце статьи — несколько простых правил, которые помогут писать удобный и надёжный код.

     18.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Компилятор за выходные: синтаксический анализатор Уорли

Изначально, когда я решил написать компилятор за выходные, я решил, что нет смысла заморачиваться, и использовал сторонний лексический / синтаксический анализатор. Мой выбор пал на SLY, довольно известную библиотеку. И действительно, пара часов работы, и мой компилятор прекрасно строил синтаксические деревья из исходного кода на wend.

     18.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Вопросы и обсуждения

Python Bytes: #420 90% Done in 50% of the Available Time

Очередной выпуск англоязычного подкаста Python Bytes

     18.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Проверка IFC моделей по требованиям IDS

В сфере строительного проектирования все больше места занимают технологии информационного моделирования (ТИМ). главным форматом обмена данных в ТИМ является формат IFC.

     19.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Релизы

Sphinx - 8.2.0

Python генератор документации. Скачать можно по ссылке: https://pypi.python.org/pypi/Sphinx/

     17.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Автомодерация изображений: как исправлять нарушения, сохраняя количество и качество контента

Раньше мы блокировали объявления, которые нарушают правила публикации, а теперь исправляем — с помощью ML-системы. Так мы сохраняем количество контента, сокращаем стоимость модерации и улучшаем пользовательский опыт. В статье подробно расскажу обо всех этапах внедрения новой ML-механики: от идеи и исследования подходов до оптимизации нейронок и вывода в продакшен.

     17.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Простыми словами о методе максимального правдоподобия и информации Фишера

Сегодня я хотел бы рассказать про метод максимального правдоподобия и информацию Фишера и еще несколько смежных тем, которые активно используются в машинном обучении и анализе данных. Расскажу я об этом просто, понятно и без воды, но с практическими примерами, в том числе на Python.

     16.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Как создать скрипт-beautifier в Ghidra на Python?

Приветствую, дорогой читатель. Хочу представить вашему вниманию пример, как можно упростить себе жизнь при исследовании кода программ, используя скриптинг в Ghidra.Если вы уже имели опыт работы с дизассемблером, то заметили, что читать его вывод не так легко, если целью является понять более высокие абстракции, заложенные в нём.

     15.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Порядок работы с устареванием ML моделей. Шаг 2: Создание надежных и долговечных моделей

Еще на этапе создания модели следует проделать работу направленную на замедление ее устаревания.Реализацию процесса работы с устареванием моделей в ML можно разделить на 4 шага.В этой части мы с вами узнаем как создать надежную и долговечную модель, а также получить много полезной информации, которая поможет нам бороться с устареванием в будущем.Мы пройдем полный путь создания модели и работы над замедлением ее устаревания.

     15.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Моделирование управления AC двигателя — Field oriented control of PMSM с помощью opensource решений

В этой статье я хочу поделиться результатом своих исследований в области моделирования систем управления двигателями переменного тока.

     14.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи
     14.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Обучить модель RoBERTa расстановке запятых на балконе для продакшена

RoBERTa — улучшенная версия модели BERT, разработанная Facebook AI. Она показывает отличные результаты в задачах обработки естественного языка, таких как классификация текстов и генерация ответов.Построим конкурентоспособный сайт расстановки пунктуации, обучив свою нейронную сеть.

     13.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Экосистема для разработки и применения Computer Vision (CV) в промышленности

В этой статье мы хотим поделиться опытом разработки экосистемы (если есть слово поудачнее, то обязательно поделитесь в комментариях) сервисов для упрощения процесса разработки моделей и решений по CV. 

     13.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Русские тексты. Работа с текстами. Предварительная обработка русских текстовых данных

Предварительная обработка текстовых данных: ключевые этапы и методыТекстовые данные — один из самых сложных типов данных для анализа из-за их неструктурированной природы и высокой вариативности. Чтобы превратить "сырой" текст в информацию, пригодную для машинного обучения или лингвистического анализа, требуется предварительная обработка.

     17.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Смогу ли я уложить оптимизирующий компилятор в тысячу строк питона? Прогон первый: mem2reg

Год назад мне пришлось взять на себя курс лекций по теории компиляторов. Вы встречались некомпетентными преподавателями? Это я, здравствуйте! Прежде чем учить других, я всё-таки решил заглянуть в учебник сам, и это вылилось в серию статей "компилятор за выходные" (да, я помню, что за мной должок с описанием лексера/парсера). В итоге я уложил компилятор со мной придуманного си-подобного языка на GNU ассемблер в шестьсот строк кода, причём без внешних зависимостей, включая парсинг.

     16.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Сводка pythonz 09.02.2025 — 16.02.2025

А теперь о том, что происходило в последнее время на других ресурсах.

     13.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Давайте писать удобное локальное окружение…

СМОТРИТЕ КОММЕНТАРИИ!

В данной статье я хочу представить выстраданную годами структуру проекта и организацию его окружения, которые помогают избежать большей части проблем, связанных с локальным разворачиванием проекта.Пример будет представлен для Django проекта и PDM в качестве менеджера зависимостей, но концептуально должен подходить для любого проекта на любом языке и с любым набором сервисов.

     13.02.2025       Выпуск 583 (10.02.2025 - 16.02.2025)       Статьи

Нативный non-blocking I/O через Linux Epoll: создание C-расширений для Python

Если вам приходилось писать высоконагруженные сетевые приложения на Python, то вы, скорее всего, сталкивались с тем, что стандартные механизмы работы с вводом‑выводом — select(), poll() и даже asyncio — не справляются с большой нагрузкой.