IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     01.03.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Методы распознавания матерных (и не только) языков

В одном из проектов появилась фича по добавлению тегов по интересам. Любой пользователь может создать интерес, и он будет виден всем остальным. Неожиданно (!!!) появились интересы с не очень хорошими словами, которые обычно называют матерными. Встала задача по распознаванию языка с матерными словами, чтобы исключить возможность добавления гадости в наш огород!

     01.03.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Обзор лучших API для транскрибации речи 2025

На прошлой неделе мы сравнивали селфхарм селфхост решения для speech-to-text на Apple Silicon процессорах. Но что делать, если вы - бизнес, и вам нужно API для транскрибации? Или что делать, если вы - разработчик, и вам просто хочется сделать пет-проект с транскрибацией? Сейчас посмотрим, какие варианты есть на рынке, и какой из них самый лучший (спойлер - однозначного победителя нет).

     01.03.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

MicroPython на STM32F4xx на собственной печатной плате. Ч.1. Погружение в MicroPython и его возможности

В этой статье попытаюсь подробно указать/рассказать, как я запустил MicroPython на микроконтроллере STM32F411RET6.

     03.03.2025       Выпуск 586 (03.03.2025 - 09.03.2025)       Статьи

Исследование набора данных для обучения LVLM — SeeClick (Web Data)

В данной статье будет рассмотрен набор данных для обучения LVLM (Large Visual Language Model), который использовался авторами статьи "SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents" при обучении модели SeeClick, которая показывает достаточно неплохие результаты, по сравнению с аналогичными решениями.

     02.03.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Taigram: Архитектура приложения

Мы продолжаем работу над нашим Open Source проектом Taigram! Прошлая статья "Taigram: Начало работы", можно сказать, была посвящена организационным моментам:

     28.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи
     27.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Centrifugo v6 + FastAPI + Python: разрабатываем веб-опросник с обновлениями в реальном времени

В этот раз разберем Centrifugo – технологию, которая берет на себя всю работу с WebSockets и масштабированием! В статье мы разберем теорию, а затем на практике разработаем веб-приложение-опросник, где результаты обновляются в реальном времени без перезагрузки страницы.

     27.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Как автоматически отслеживать новости компаний по своему портфелю?

Как частный инвестор, я всегда ищу способы упростить управление своим портфелем. Особенно меня интересуют высокодоходные облигации. Да, они немного "мусорные", но я не стремлюсь быть финансовым аналитиком в этом или детально изучать каждого эмитента.Моя цель проста: купить бумаги и получать купоны, то есть стабильный доход.

     27.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

How to Work With Polars LazyFrames

A Polars LazyFrame provides an efficient way to handle large datasets through lazy evaluation. Unlike traditional DataFrames, LazyFrames don’t contain data but instead store a set of instructions known as a query plan.

     27.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Умный помощник для корпоративного обучения: опыт внедрения RAG-системы в крупной компании

В этой статье мы детально разберем процесс создания корпоративной RAG-системы для поиска по обучающим материалам.

     26.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

«Чем ближе к вокзалу, тем хуже кебаб?»: «исследование»

Во французском сабреддите я наткнулся на пост с интересной гипотезой: Чем ближе точка к вокзалу, тем хуже там кебаб.Пост на французском привлёк достаточно большое внимание, учитывая относительно небольшой размер сабреддита; это доказывало, что многие с ним согласны.

     26.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

FastAPI Deconstructed: Anatomy of an ASGI Framework

This article, based on a PyCon APAC talk, covers just what FastAPI does under the hood.

     26.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Мама, у меня RAG: пути к улучшению, когда он «наивный»

Целью данной статьи является погружение читателя в технологию RAG, а также ознакомление с основными критериями и методами его улучшения. В этой статье мы обсудим, как именно устроен RAG, как правильно оценивать его эффективность и какие существуют техники улучшения – от уже известных методов до совершенно новых решений.

     25.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Łukasz Langa: A peek into a possible future of Python in the browser

My Python code was too slow, so I made it faster with Python. For some definition of “Python”.

     24.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Как выбрать embedding модель без датасета и исторических данных

С появлением больших языковых моделей тема векторного поиска обрела новое дыхание. Компании, которые хотят внедрить архитектуру Retrieval-Augmented Generation (RAG), сталкиваются с вопросом: как выбрать эмбеддинги, которые будут работать эффективно именно с их данными?

     22.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Управляем компьютером жестами: создаем систему бесконтактного взаимодействия с ПК

В основе проекта лежит компьютерное зрение и машинное обучение. Система использует веб-камеру для захвата изображения рук пользователя в реальном времени. Затем специально обученная нейронная сеть распознает конкретные жесты и преобразует их в команды управления компьютером. Проект полностью открыт и доступен на GitHub.

     22.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Вебсокеты на FastAPI: Реализация простого чата с комнатами за 20 минут

Хотите освоить WebSocket и создать собственный чат с комнатами? Статья написана с учетом новичков, но и опытные разработчики найдут здесь полезные инсайты.

     21.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи

Gambit Scheme: интегрируемся с Python

Статья продолжает рассмотрение неочевидных возможностей Gambit Scheme, начатое в предыдущих статьях.На этот раз расскажем о том, как использовать в программах на Gambit Scheme код на языке Python, в том числе многочисленные библиотеки, разработанные для Python.

     24.02.2025       Выпуск 585 (24.02.2025 - 02.03.2025)       Статьи

Как сканировать документы А3 формата, если под рукой только сканер А4 формата

Оцифровка чертежей и документов формата А3 не представляет сложности, если у вас есть сканер соответствующего размера. Однако что делать, если под рукой лишь стандартное МФУ формата А4? Формат А3 в два раза больше А4: это два стандартных листа, соединенных по длинной стороне.

     21.02.2025       Выпуск 584 (17.02.2025 - 23.02.2025)       Статьи