Собрали в одном месте самые важные ссылки
читайте авторский блог
Сегодня it-сообщество предлагает большое количество любопытных инструментов для создания RAG-систем. Среди них особенно выделяются два фреймворка — LangChain и LlamaIndex. Как понять, какой из них подходит лучше для вашего проекта?
(05.09.2022 - 11.09.2022)
Вы провели опрос клиентского опыта в вашей компании. В данном случае на каждый вопрос клиенты отвечали по 10 бальной шкале, где 1 - совсем неудовлетворен, а 10 - полностью удовлетворен. Вопросы разбиты на несколько тематических блоков.
Привет, Хабр! На связи снова Юрий Кацер, эксперт по ML и анализу данных в промышленности, а также руководитель направления предиктивной аналитики в компании «Цифрум» Госкорпорации “Росатом”. До сих пор рамках рабочих обязанностей решаю задачи поиска аномалий, прогнозирования, определения остаточного ресурса и другие задачи машинного обучения в промышленности. В рамках рабочих задач мне приходится часто сталкиваться с проблемой правильной оценки качества решения задачи, и, в частности, выбора правильной data science метрики в задачах обнаружения аномалий.
Для торгового автомата, описанного в статье, потребовалась программа с интерфейсом оператора - несколько диалоговых окон. Смесь справочника с обучающими видео, меню выбора текущего видео и прочих настроек.
Сегодня я хочу попробовать что-то новое и начну исследовать мир Python. В этой статье представлен пошаговый туториал по реализации простого REST API при помощи Python, Fast API, Hydra и Mamba.
Данная статья будет полезна тем, чья деятельность связана с Data Engineering, и тем, кто только знакомится с этой славной профессией. Вы узнаете про особенности настройки и интеграции Kafka со Structured Streaming, а также увидите различные способы чтения данных, работы с водяными метками и скользящим окном.
Набор данных Financial News Sentiment Dataset (FiNeS) содержит в себе заголовки финансовых новостей о компаниях, торгующихся на Московской и СПб биржах. Целевой переменной датасета является оценка тональности новостных заголовков в виде вещественного числа. Идеи для использования датасета: Создание трейдинговых стратегий на основе анализа тональности новостей "на лету"; Анализ новостного фона в разрезе времени (день/неделя) или в разрезе компании.
При разработке чат-ботов и голосовых ассистентов часто возникает задача нахождения семантического сходства слов. Причина тому – наличие в языке большого количества схожих по смыслу слов и выражений.
Как создать приложение с открытым кодом для планирования пеших походов и выбора оптимального маршрута? Любой заядлый турист знает: всё, что ждёт его в походе, зависит от подготовки.
LangChain vs LlamaIndex: проектируем RAG и разбираемся, что выбрать для вашего проекта
Python⇒Speed: Faster pip installs: caching, bytecode compilation, and uv
Быстрый старт в мир Python окружений с uv
Основы очистки данных в data science
Joblib: максимум из параллельных вычислений в Python
pyper: Concurrent Python Made Simple
Создание персонального AI-ассистента с использованием RAG: пошаговое руководство
6 разочарований при создании командного инструмента
Большое обновление CV-возможностей для фреймворка Simple
Как сделать SMS-оповещение о землетрясениях с GeoJSON и SMS API
Руководство по восстановлению удаленных сообщений и медиаданных в Telegram
Пишем морской бой на VueJS и Python
tuple в CPython – мутабельный! И другие шокирующие детали из C-шной реализации
Python и нечеткое сопоставление: решение проблемы разнобоя в адресах