Новый материал в ленте

Швейцарский армейский нож веб-разработки Python. Скачать можно по ссылке: https://pypi.python.org/pypi/Werkzeug/

Python Дайджест. Выпуск 583

(10.02.2025 - 16.02.2025)

поделиться выпуском

Статьи

Сводка pythonz 09.02.2025 — 16.02.2025

А теперь о том, что происходило в последнее время на других ресурсах.

Автоматизация разведочного анализа данных (EDA) с помощью Python

Если вы когда-нибудь занимались машинным обучением, то знаете — перед тем как строить модель, нужно как следует изучить свои данные. Этот этап называется EDA (Exploratory Data Analysis), или разведочный анализ данных (РАД). Он критически важен — именно здесь мы находим скрытые закономерности, выдвигаем первые гипотезы и понимаем, как лучше обработать данные для будущей модели.

Как LangChain и LangGraph упрощают жизнь разработчика ИИ-Агентов

При разработке приложений на основе больших языковых моделей (LLM, Large Language Model) встает вопрос: вызывать ли модель напрямую через API (например, OpenAI) или использовать специализированные фреймворки вроде LangChain или LangGraph.

Алгоритм Краскала для генерации идеальных лабиринтов

Алгоритм Краскала — это жадный алгоритм, который используется для нахождения минимального остовного дерева (MST) в связном, взвешенном и неориентированном графе. В контексте генерации лабиринтов он применяется для создания структуры, где каждая ячейка соединена с другими без циклов и недостижимых областей. В результате получается так называемый "идеальный лабиринт", в котором из любой точки можно попасть в любую другую по единственному пути.

meejah.ca: Terminal Visualizer

Msgspec vs DataClasses: битва инструментов в мире Python-сериализации

Сегодня разберем два популярных инструмента — Msgspec и DataClasses. Оба помогают структурировать данные, добавить энтерпрайзности в проект, но подходы у них разные. Какой из них быстрее и удобнее, где их лучше применять?

Нативный non-blocking I/O через Linux Epoll: создание C-расширений для Python

Если вам приходилось писать высоконагруженные сетевые приложения на Python, то вы, скорее всего, сталкивались с тем, что стандартные механизмы работы с вводом‑выводом — select(), poll() и даже asyncio — не справляются с большой нагрузкой.

Русские тексты. Работа с текстами. Предварительная обработка русских текстовых данных

Предварительная обработка текстовых данных: ключевые этапы и методыТекстовые данные — один из самых сложных типов данных для анализа из-за их неструктурированной природы и высокой вариативности. Чтобы превратить "сырой" текст в информацию, пригодную для машинного обучения или лингвистического анализа, требуется предварительная обработка.

Экосистема для разработки и применения Computer Vision (CV) в промышленности

В этой статье мы хотим поделиться опытом разработки экосистемы (если есть слово поудачнее, то обязательно поделитесь в комментариях) сервисов для упрощения процесса разработки моделей и решений по CV.

Обучить модель RoBERTa расстановке запятых на балконе для продакшена

RoBERTa — улучшенная версия модели BERT, разработанная Facebook AI. Она показывает отличные результаты в задачах обработки естественного языка, таких как классификация текстов и генерация ответов.Построим конкурентоспособный сайт расстановки пунктуации, обучив свою нейронную сеть.

PyPI Now Supports iOS and Android Wheels for Mobile Python Development

Как создать скрипт-beautifier в Ghidra на Python?

Приветствую, дорогой читатель. Хочу представить вашему вниманию пример, как можно упростить себе жизнь при исследовании кода программ, используя скриптинг в Ghidra.Если вы уже имели опыт работы с дизассемблером, то заметили, что читать его вывод не так легко, если целью является понять более высокие абстракции, заложенные в нём.

Давайте писать удобное локальное окружение…

СМОТРИТЕ КОММЕНТАРИИ!

В данной статье я хочу представить выстраданную годами структуру проекта и организацию его окружения, которые помогают избежать большей части проблем, связанных с локальным разворачиванием проекта.Пример будет представлен для Django проекта и PDM в качестве менеджера зависимостей, но концептуально должен подходить для любого проекта на любом языке и с любым набором сервисов.

Моделирование управления AC двигателя — Field oriented control of PMSM с помощью opensource решений

В этой статье я хочу поделиться результатом своих исследований в области моделирования систем управления двигателями переменного тока.

Порядок работы с устареванием ML моделей. Шаг 2: Создание надежных и долговечных моделей

Еще на этапе создания модели следует проделать работу направленную на замедление ее устаревания.Реализацию процесса работы с устареванием моделей в ML можно разделить на 4 шага.В этой части мы с вами узнаем как создать надежную и долговечную модель, а также получить много полезной информации, которая поможет нам бороться с устареванием в будущем.Мы пройдем полный путь создания модели и работы над замедлением ее устаревания.

Учебник — всё, что вам нужно

Немного вызывающее название статьи отсылает к известной работе Внимание - всё, что вам нужно. На этот раз речь пойдет о качестве данных, на которых обучают LLM. Оказывается, качественный учебник (как концентрат знаний в любой сфере) в разы сокращает потребность и в памяти, и в мощности GPU, и в деньгах инвесторов...

Твой ИИ тебя понимает? Разбираем тайны внутреннего мира языковых моделей

Современные крупные языковые модели, такие как ChatGPT, Claude или Gemini, поражают своими возможностями. Но главный вопрос остаётся открытым: как именно они думают?

Вопросы и обсуждения

Talk Python to Me: #493: Quarto: Open-source technical publishing

Audio

Интересные проекты, инструменты, библиотеки

soupsieve: CSS Selector Implementation for BeautifulSoup

platformdirs: Get Platform-Specific Dirs, e.g. “User Data Dir”

oumi - обучение и работа с моделями с нуля

Kiln - fine-tuning LLM models

Релизы

psutil - 7.0.0

Модуль для управления процессами в ОС. Скачать можно по ссылке: https://pypi.python.org/pypi/psutil/

django-filter - 25.1

Django-приложение для гибкой фильтрации объектов модели (querysets). Скачать можно по ссылке: https://pypi.python.org/pypi/django-filter/

coverage - 7.6.12

Утилита позволяющая измерить процент покрытия тестами. Скачать можно по ссылке: https://pypi.python.org/pypi/coverage/

beautifulsoup4 - 4.13.2

XML/HTML парсер. Скачать можно по ссылке: https://pypi.python.org/pypi/beautifulsoup4/

pip - 25.0.1

Утилита для управления модулями в Python. Скачать можно по ссылке: https://pypi.python.org/pypi/pip/

lxml - 5.3.1

Мощный и быстрый модуль для обработки XML/HTML. Скачать можно по ссылке: https://pypi.python.org/pypi/lxml/

pymongo - 4.11.1

Python интерфейс для MongoDB. Скачать можно по ссылке: https://pypi.python.org/pypi/pymongo/

virtualenv - 20.29.2

Инструмент создания виртуального рабочего окружения. Скачать можно по ссылке: https://pypi.python.org/pypi/virtualenv

numpy - 2.2.3

Модуль для работы с многомерными массивами. Скачать можно по ссылке: https://pypi.python.org/pypi/numpy/

Еще новости

Werkzeug - 3.1.8

django-debug-toolbar - 6.3.0

Gotchas With SQLite in Production

imbox - 0.10.1

Comparing Portable DataFrame Tools in Python

Фабрики в тестировании (Python, Django, pytest, factory_boy)

Making Friendly Classes

syrupy: The Sweeter pytest Snapshot Plugin

aiohttp - 3.13.5

Smello for HTTP Requests

requests - 2.33.1

Мы сделали лучший REST фреймворк для Django

Где была Алиса Селезнева. Искал ее адреса с помощью Python

numpy - 2.4.4

Apache Superset — боремся с фильтрами по дате. Часть 2

IT-новости про Python, которые стоит знать