IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
консультируем про IT, Python


Новый материал в ленте
  virtualenv - 20.30.0

Инструмент создания виртуального рабочего окружения. Скачать можно по ссылке: https://pypi.python.org/pypi/virtualenv


Python Дайджест. Выпуск 585

(24.02.2025 - 02.03.2025)

поделиться выпуском 
Дайджест python,

Статьи

  Taigram: Архитектура приложения

Мы продолжаем работу над нашим Open Source проектом Taigram! Прошлая статья "Taigram: Начало работы", можно сказать, была посвящена организационным моментам:

  Как выбрать embedding модель без датасета и исторических данных

С появлением больших языковых моделей тема векторного поиска обрела новое дыхание. Компании, которые хотят внедрить архитектуру Retrieval-Augmented Generation (RAG), сталкиваются с вопросом: как выбрать эмбеддинги, которые будут работать эффективно именно с их данными?

  Łukasz Langa: A peek into a possible future of Python in the browser

My Python code was too slow, so I made it faster with Python. For some definition of “Python”.

  FastAPI Deconstructed: Anatomy of an ASGI Framework

This article, based on a PyCon APAC talk, covers just what FastAPI does under the hood.

  Умный помощник для корпоративного обучения: опыт внедрения RAG-системы в крупной компании

В этой статье мы детально разберем процесс создания корпоративной RAG-системы для поиска по обучающим материалам.

  How to Work With Polars LazyFrames

A Polars LazyFrame provides an efficient way to handle large datasets through lazy evaluation. Unlike traditional DataFrames, LazyFrames don’t contain data but instead store a set of instructions known as a query plan.

  Мама, у меня RAG: пути к улучшению, когда он «наивный»

Целью данной статьи является погружение читателя в технологию RAG, а также ознакомление с основными критериями и методами его улучшения. В этой статье мы обсудим, как именно устроен RAG, как правильно оценивать его эффективность и какие существуют техники улучшения – от уже известных методов до совершенно новых решений.

  «Чем ближе к вокзалу, тем хуже кебаб?»: «исследование»

Во французском сабреддите я наткнулся на пост с интересной гипотезой: Чем ближе точка к вокзалу, тем хуже там кебаб.Пост на французском привлёк достаточно большое внимание, учитывая относительно небольшой размер сабреддита; это доказывало, что многие с ним согласны.

  Как автоматически отслеживать новости компаний по своему портфелю?

Как частный инвестор, я всегда ищу способы упростить управление своим портфелем. Особенно меня интересуют высокодоходные облигации. Да, они немного "мусорные", но я не стремлюсь быть финансовым аналитиком в этом или детально изучать каждого эмитента.Моя цель проста: купить бумаги и получать купоны, то есть стабильный доход.

  Centrifugo v6 + FastAPI + Python: разрабатываем веб-опросник с обновлениями в реальном времени

В этот раз разберем Centrifugo – технологию, которая берет на себя всю работу с WebSockets и масштабированием! В статье мы разберем теорию, а затем на практике разработаем веб-приложение-опросник, где результаты обновляются в реальном времени без перезагрузки страницы.

  MicroPython на STM32F4xx на собственной печатной плате. Ч.1. Погружение в MicroPython и его возможности

В этой статье попытаюсь подробно указать/рассказать, как я запустил MicroPython на микроконтроллере STM32F411RET6.

  Обзор лучших API для транскрибации речи 2025

На прошлой неделе мы сравнивали селфхарм селфхост решения для speech-to-text на Apple Silicon процессорах. Но что делать, если вы - бизнес, и вам нужно API для транскрибации? Или что делать, если вы - разработчик, и вам просто хочется сделать пет-проект с транскрибацией? Сейчас посмотрим, какие варианты есть на рынке, и какой из них самый лучший (спойлер - однозначного победителя нет).

  Методы распознавания матерных (и не только) языков

В одном из проектов появилась фича по добавлению тегов по интересам. Любой пользователь может создать интерес, и он будет виден всем остальным. Неожиданно (!!!) появились интересы с не очень хорошими словами, которые обычно называют матерными. Встала задача по распознаванию языка с матерными словами, чтобы исключить возможность добавления гадости в наш огород!

  Сводка от pythonz 23.02.2025 — 02.03.2025

А теперь о том, что происходило в последнее время на других ресурсах.

  Как сканировать документы А3 формата, если под рукой только сканер А4 формата

Оцифровка чертежей и документов формата А3 не представляет сложности, если у вас есть сканер соответствующего размера. Однако что делать, если под рукой лишь стандартное МФУ формата А4? Формат А3 в два раза больше А4: это два стандартных листа, соединенных по длинной стороне.

Видео

  Недописанная Кафкой Сага

О внедрении паттерна Saga в HoReCa FoodTech для исправления интеграции с блокирующимся кассовым оборудованием в ресторанах. Как это спасло нашу тех.поддержку. Какие уроки мы вынесли. И почему же Кафка не дописал(а) свою сагу…

  NLP нейросети в защите данных: опыт Makves DCAP

В этом докладе я расскажу о том, как мы использовали NLP решения для расширения возможностей DCAP (data-centric audit and protection) системы компании Makves. Мы обсудим, почему обработка неструктурированных текстовых данных без нейросетей является сложной задачей и как мы преодолели эти вызовы. Я поделюсь нашим опытом сбора и подготовки датасета, а также раскрою трюки и методы, которые мы применяли для оценки качества полученных решений. Также рассмотрим ограничения, с которыми мы столкнулись при продуктивизации моделей, и как мы их преодолели. Доклад будет полезен как опыт реального внедрения NLP функционала в работающий продукт.

  Опыт использ. Python для автом. бизнес-процессов

От автоматизации нажатия кнопок, до создания полноценных интеграций систем — в этом докладе я расскажу, как мы развили наш подход к RPA, используя Python. 

Интересные проекты, инструменты, библиотеки

  intellagent - framework for agents

A framework for comprehensive diagnosis and optimization of agents using simulated, realistic synthetic interactions

  Netleaf: разрабатываем открытый сканер сети на Python и PySide6

Сегодня я хочу представить свой проект Netleaf — открытый инструмент для сканирования сети, написанный на Python с использованием PySide6 для графического интерфейса. Проект создавался с целью предложить простой, но функциональный инструмент для сканирования устройств локальной сети.

  LilyFoote/django-rusty-templates

An experimental reimplementation of Django's templating language in Rust.

  AghastyGD/lazy-ninja

Automate CRUD API endpoints with Django Ninja, featuring dynamic schema generation, customizable hooks, and automatic API documentation.

Релизы

  IPython - 9.0.0

Интерактивная оболочка для языка программирования Python. Скачать можно по ссылке: https://pypi.python.org/pypi/IPython

  pytest - 8.3.5

Простой мощный инструмент тестирования в Python. Скачать можно по ссылке: https://pypi.python.org/pypi/pytest/

  aiohttp - 3.11.13

http клиент/сервер для asyncio. Скачать можно по ссылке: https://pypi.python.org/pypi/aiohttp