IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте нас в Telegram

     30.04.2024       Статьи

Подбор гиперпараметров RAG-системы с помощью Optuna

Сказ о том, как с помощью Opuna’ы сделать вашу RAG-систему чуточку (а может и не чуточку) эффективнее :)

RAG-система это такой персональный карманный поисковик (а-ля Гугл или Яндекс), который может искать по локальным документам вашего кровавого энтерпрайза :)

     29.04.2024       Статьи

Погружение в метаклассы в Python

Задумывались ли вы, почему функция isinstance(int, object) возвращает True? Объяснение, что все является объектом, которое можно часто услышать, хоть и является правдой, но не дает ответа на вопрос и на самом деле есть профанация, потому что не дает настоящего понимания, а создает только его видимость.

     28.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Сводка от pythonz net 21.04.2024 — 28.04.2024

А теперь о том, что происходило в последнее время на других ресурсах.

     28.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

ViT для новичков: как нейросети научились определять зависимости в изображениях

В этой статье мы попытаемся рассказать про трансформерную архитектуру VIT и предысторию его формирования. Сегодня не совсем понятно, почему этот "формат" нейронок настолько эффективен. Некоторые говорят механизм внимания, но некоторые практики делают больше ставок в области Computer Vision на MetaFormer. https://github.com/sail-sg/poolformer

     28.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Похоже, я придумал свой алгоритм поиска кратчайшего пути

Я реализовал, похоже, собственный алгоритм поиска кратчайшего пути с отрицательными ребрами графа.

Почему собственный? Я искал подобное решение, но не нашел, возможно, оно уже было реализовано, просто плохо поискал

     28.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Анализ мощности статистических критериев с использованием бакетизации

В данной статье рассматривается влияние бакетизации на мощность статистических критериев в условиях различных распределений данных и при разном объеме выборки. Особое внимание уделено зависимости мощности критерия от количества бакетов и размера выборки. Исследование предоставляет важные выводы для проектирования и анализа A/B тестирования и других форм экспериментальных исследований.

     26.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Предлагаю немного пошалить и поговорить о слегка необычном, но весьма забавном проекте обучения нейросетевой модели на базе LLaMA2 7B, которая умеет превращать невинные предложения на русском языке в чуть более "токсичные" их версии.

     26.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Обработка данных для RAG-систем

Решил начать прокачку с простой внутренней задачи — сократить время на поиск информации в корпоративной вики с помощью LLM. Бизнес-результат прозрачный — каждый сотрудник должен находить ответ на свой запрос за пару секунд, без долгого путешествия по всем страницам базы знаний.

     29.04.2024       Статьи

LLM Leaderboard за апрель 2024

Сегодня мы поговорим о том, какие LLM лучше всего работают на бизнес-задачах. AI-хайп находится на локальном пике, похоже, что весь мир только и делает, что внедряет AI-фичи в свои продукты, собирает миллионы на разработку еще одной оболочки для ChatGPT, заполняет свои ряды AI-тулами и, кажется, предоставляет работу роботам, пока сами попивают кофе в старбаксе. 

     28.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Мега-Учебник Flask Глава 6: Страница профиля и аватары (издание 2024)

Это шестая часть серии мега-учебника Flask, в которой я собираюсь рассказать вам, как создать страницу профиля пользователя.

     26.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

От кода до сертификата: Создание веб-приложения на Python Flask для автоматизации выдачи сертификатов

Тема моей статьи — создание веб-приложения на Python Flask для автоматизации выдачи сертификатов

     26.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Распознавание, хранение и поиск лиц в базе данных

В этой статье я максимально коротко и просто объясню принцип распознавания, хранения и поиска лиц в базе данных. В качестве примера будет использована библиотека Insightface и база данных PostgreSQL.

     26.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Как решить типичные проблемы Django нестандартным подходом: Fake Injection

Мы часто сталкиваемся с толстыми моделями и сериалайзерами, размытой бизнес-логикой и тестированием, которое больше напоминает головную боль, чем удовольствие. В этой статье я расскажу о методах нашей команды, которые помогли нам справиться с этими проблемами и привести код к новому уровню надежности и эффективности.

     25.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Без холивара «переписать все на Go»: проблема переносимости в Python и ее решение

На скриптовых языках удобно разрабатывать… И на этом удобство заканчивается. Вне машины разработчика начинаются проблемы. Особенно если вы пишете какой-то прикладной тулинг — cli-утилиты, вспомогательные приложения в вашем SDK и прочее. Вы даже не можете рассчитывать на то, что у пользователя будет pip, чтобы он смог поставить все ваши зависимости, вам все нужно организовать самостоятельно.

     25.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Обратный инжиниринг дешевой мини видеокамеры из семейства А9

В данной статье речь пойдет о Wi-Fi мини видеокамере из семейства А9 от китайских производителей. Цель исследования этих камер – расширить возможность их применения, которая ограничена использованием только стандартных приложений для мобильных устройств на базе Android или iOS.

     24.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Моделирование курса валют методом Монте-Карло

Метод Монте-Карло — это мощный инструмент стохастического моделирования, который используется в самых разнообразных областях науки и инженерии. В финансах, этот метод часто применяется для анализа и прогнозирования временных рядов, таких как курс валют или акций. Использование Монте-Карло позволяет оценить не только ожидаемые значения, но и распределение возможных исходов, что крайне важно для управления рисками и принятия обоснованных инвестиционных решений.

     24.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Как мы проанализировали весь VC, и поняли что делает посты успешными кроме контента. (Спойлер — длина заголовка)

Вы когда-нибудь задумывались, почему некоторые посты набирают тысячи просмотров, а другие остаются незамеченными? Ясно, что Content is King, но есть ли дополнительные факторы, которые влияют на успешность поста?

     23.04.2024       Выпуск 541 (22.04.2024 - 28.04.2024)       Статьи

Временное хранилище данных на Apache Druid: почему это эффективно сработало для загрузки табличных файлов

Тысячи сотрудников заказчика каждый день создают сотни таблиц: отчеты, списки, прогнозы, статистика. К нам заказчик пришел с запросом: создать временное хранилище данных для создания аналитических витрин.

В статье опишу, почему для реализации проекта мы выбрали именно Druid, с какими особенностями реализации столкнулись, как сравнивали методы реализации датасорсов.

     21.04.2024       Выпуск 540 (15.04.2024 - 21.04.2024)       Статьи

Мега-Учебник Flask Глава 5: Логины пользователей (издание 2024)

Это пятая часть серии мега-учебника Flask, в которой я собираюсь рассказать вам, как создать подсистему входа пользователей.

     20.04.2024       Выпуск 540 (15.04.2024 - 21.04.2024)       Статьи

Создаем свой диалект змеиного, или DSL на Python

Допустим, у нас есть некоторое исполнительное ядро и множество пользователей, владеющих Python на уровне «изучи его полностью за неделю». Они хотят решать задачи своей предметной области, с минимальными усилиями используя сервисы ядра.