Собрали в одном месте самые важные ссылки
читайте нас в Twitter
Сегодня it-сообщество предлагает большое количество любопытных инструментов для создания RAG-систем. Среди них особенно выделяются два фреймворка — LangChain и LlamaIndex. Как понять, какой из них подходит лучше для вашего проекта?
(16.05.2016 - 22.05.2016)
В спецификации описаны минимально необходимый функционал и свойства для разработки системы управления пакетами.
Этот PEP предлагает протокол для классов, которые представляют путь файловой системы. Стандарт направлен на правильное представление строковое и байтовое этих данных. Цель в том, чтобы упростить работу с путями, так как код работающий с путями сможет работать сразу со строками или байтами. Это критично для файловых систем, где есть разделение между строковым и/или байтовым представлением путей.
3-4 июля недалеко от Москвы пройдет четвертая конференция для python-разработчиков PyCon Russia. Программа получается очень сильной — Raymond Hettinger (Python core developer с 2001 года, автор и мэйнтейнер многих частей языка, США), Martin Görner (Developer Relations, Google, Франция), Nathaniel Manista (Computer Scientist, Google, США), Armin Ronacher (Flask framework, Австрия), David MacIver (Hypothesis, Великобритания), Jackie Kazil (Technical Fellow at Capital One, США), Александр Сибиряков (Scrapinghub, Чехия), Андрей Светлов (DataRobot, Украина), докладчики из HeadHunter, Rambler&Co, Positive Technologies — и это еще не все.
Chris Moffitt предлагает всем поделиться опытом использования Python в реальных задачах.
Статья о применении сервиса Twilio (в роли SMS) для организации связи Slack чата и SMS оповещения
В этой статье я хотел бы остановиться на алгоритмах распознавания лиц, а заодно познакомить вас с очень интересной и полезной библиотекой OpenCV. Уверен, что этот материал окажется полезным для новичков в этой области.
Что нам понадобится:
• Установленный Python 2.7 с библиотеками NumPy и PIL
• OpenCV 2-й версии
Здесь ссылка на материал по установке всех необходимых компонентов. Установка всего необходимого не составит труда.
Автор статьи рассказывает как можно встраивать в wheels пакеты условные зависимости на основе пепов 426 и 508
Биткоин-бот имени Дональда Трампа, победа AlphaGo над одним из сильнейших игроков в го Ли Седолем, изучение английского языка — что объединяет эти три ситуации? Везде в той или иной степени присутствует машинное обучение. Компьютер может не только генерировать сюжетную канву, как Scheherazade, или отвечать на письма вместо пользователей, как Google Smart Reply, но и создавать идеальные учебники английского языка. Читать дальше →
Пост «Удаление кода» Неда Бэтчелдера (Ned Batchelder) недавно появился на HN, хотя изначально он был написан в 2002 году. Здесь я хочу повторить несколько мыслей Неда, и занять более решительную, чем он, позицию: удаляйте код, как только вы замечаете, что он больше не нужен, без лишних вопросов. Я также предложу некоторые советы из окопов, как определять кандидатов в мертвый код.
При работес большим количеством данных (которые не помещаются в память) приходится бить данные на части и складывать их на диск. Эта статья рассказывает о том, как все части больших данных можно сжимать и при этом сохранять персистентность.
Автор статьи затрагивает тему поддержки модулей для двух версий Python, а именно, тот самый глобальный переход на Python 3000. Автор задается вопросом "А что если поддерживать актуальные версии бесплатно, а старые за деньги"
Статья рассматриваем применение Keras для решения задачи распознавания цифр
Небольшой пример использования библиотеки pytesseract для извлечения текста с картинок
Небольшая статья о том, как можно решить одну и ту же задачу несколькими способами. Предназначена для новичков в Python и программировании.
В качестве примера взят простой случай — реализация диалога подтверждения какой-либо операции. Программа задает пользователю вопрос Вы уверены? [Д/н (Y/n)]:, на который требуется ответить, введя одно из восьми допустимых значений (Д, д,Н, н, Y, y, N, n).
Целью данного курса является дать вам целостное понимание машинного обучения.
Автодополнение и подсказки присутствуют.
Пакет позволяет писать в универсальном стиле ботов для нескольких сервисов с единой конфигурацией. Также, пакет упрощает подключение API вашего сервиса к боту.
Интересная библиотека. Позволяет "на лету" импортировать C++ код из исходников. А на самом деле при импорте она компилирует код, и делает привязки.
>>> from __future__ import print_function
>>> import gossip
>>> @gossip.register('hook_name')
... def func():
... print('Called')
>>> gossip.trigger('hook_name')
Called
Asphalt framework - это веб фреймворк на основе asyncio. Рекомендуем ознакомиться с ним
autologin - упрощает задачу авторизации на сайте
from tesserocr import PyTessBaseAPI
images = ['sample.jpg', 'sample2.jpg', 'sample3.jpg']
with PyTessBaseAPI() as api:
for img in images:
api.SetImageFile(img)
print api.GetUTF8Text()
print api.AllWordConfidences()
# api is automatically finalized when used in a with-statement (context manager).
# otherwise api.End() should be explicitly called when it's no longer needed.
Система контроля и управления процессами. Изменения описаны по ссылке https://allmychanges.com/p/python/supervisor/#3.3.0. Скачать можно по ссылке: None
WSGI HTTP-сервер для UNIX. Изменения описаны по ссылке https://allmychanges.com/p/python/gunicorn/#19.5.0. Скачать можно по ссылке: None
Утилита позволяющая измерить процент покрытия тестами. Изменения описаны по ссылке https://allmychanges.com/p/python/coverage/#4.1b3. Скачать можно по ссылке: None
Приложение для поддержки тегов в Django. Приложение будет крайне полезно на сайте с новостями, которые необходимо помечать тегами, так же можно легко реализовать сортировку по тегам.. Изменения описаны по ссылке https://allmychanges.com/p/python/django-taggit/#0.18.3. Скачать можно по ссылке: None
Описание нововведений в очередном выпуске приложения для Django, позволяющего отправлять с ваших сайтов разнообразные сообщения.
LangChain vs LlamaIndex: проектируем RAG и разбираемся, что выбрать для вашего проекта
Python⇒Speed: Faster pip installs: caching, bytecode compilation, and uv
Быстрый старт в мир Python окружений с uv
Основы очистки данных в data science
Joblib: максимум из параллельных вычислений в Python
pyper: Concurrent Python Made Simple
Создание персонального AI-ассистента с использованием RAG: пошаговое руководство
6 разочарований при создании командного инструмента
Большое обновление CV-возможностей для фреймворка Simple
Как сделать SMS-оповещение о землетрясениях с GeoJSON и SMS API
Руководство по восстановлению удаленных сообщений и медиаданных в Telegram
Пишем морской бой на VueJS и Python
tuple в CPython – мутабельный! И другие шокирующие детали из C-шной реализации
Python и нечеткое сопоставление: решение проблемы разнобоя в адресах