Собрали в одном месте самые важные ссылки
и сделали Тренажер IT-инцидентов для DevOps/SRE
Мы продолжим доклад "Повышаем производительность программ: мой путь к succ[ess \| inct]" и затронем суперсжатие для полнотекстового поиска, в том числе реализуем его на Python и замерим производительность.
Применение вайбкодинга для разработки MVP проекта. Основные преимущества такого подхода и какие опасности могут возникнуть с развитием проекта. Сложность рефакторинга потеря актуальности нейросетевого кода
FastStream – библиотека для создания сервисов с асихронной или event-driven коммуникацией.
pyrefly – новый тайпчекер для Python написанный на Rust. Вторая версия тайпчерека pyre-check.
Чтобы научиться программировать и разбираться в тонкостях Python 3.12
Во втором докладе про поиск аномалий мы продолжим изучение наиболее популярных методов, сосредоточившись на Isolation Forest и PCA. Я объясню «на пальцах» как работают эти методы, а также, какие у них сильные и слабые стороны.
По мере увеличения объёма данных, структуры данных, занимающие много дополнительного места, становятся всё менее производительны и возникает вопрос: как оптимально сжать структуру данных по памяти, чтобы не потерять производительность основных операций на структуре. В докладе разберёмся со сжатыми структурами данных, их практической реализацией, а также посмотрим для каких задач их целесообразно применять.
Расскажу откуда вообще взялась идея, про сам суицид и как это дружит с машинным обучением. Основной доклад будет посвящен процессу создания датасета. В конце расскажу, когда и где можно будет взять датасет и что планируем делать дальше.
Как автоматизировать процессы в рекламном агентстве при помощи Python и какие продукты можно предложить рынку рекламы
Ведущие – Григорий Петров и Михаил Корнеев
Рассмотрим основы работы спутниковой связи, включая ключевые принципы передачи данных через спутники. Поговорим о том, как Python может быть использован для автоматизации процессов в космической сфере.
Ведущие – Григорий Петров и Михаил Корнеев
В этом докладе я расскажу о том, как мы использовали NLP решения для расширения возможностей DCAP (data-centric audit and protection) системы компании Makves. Мы обсудим, почему обработка неструктурированных текстовых данных без нейросетей является сложной задачей и как мы преодолели эти вызовы. Я поделюсь нашим опытом сбора и подготовки датасета, а также раскрою трюки и методы, которые мы применяли для оценки качества полученных решений. Также рассмотрим ограничения, с которыми мы столкнулись при продуктивизации моделей, и как мы их преодолели. Доклад будет полезен как опыт реального внедрения NLP функционала в работающий продукт.
О внедрении паттерна Saga в HoReCa FoodTech для исправления интеграции с блокирующимся кассовым оборудованием в ресторанах. Как это спасло нашу тех.поддержку. Какие уроки мы вынесли. И почему же Кафка не дописал(а) свою сагу…
Вы когда-нибудь сталкивались с тем, что языковая модель, даже лучшая, типа GPT-4 или Клод, не соблюдает строгий формат ответа? Например, выдаёт неверный JSON или добавляет лишние поля, что приводит к сбоям в сервисе? Эти проблемы могут вызывать значительные трудности при интеграции с другими системами, требуя сложных обходных решений и усложняя логику обработки данных. На этом докладе я покажу, как можно заставить модели строго следовать заданным форматам ответов. Я расскажу, как использовать современные фреймворки для контролируемой генерации, чтобы гарантировать выдачу корректных структурированных данных, будь то JSON, код или любые другие форматы. Доклад будет полезен не только специалистам по языковым моделям, но и разработчикам, знакомым с простыми концепциями конечных автоматов. Вы увидите, как эти известные алгоритмы в сочетании с языковыми моделями дают интересные результаты. Кроме того, я объясню дополнительные преимущества контролируемой генерации, такие как zero-shot классификация, вызов внешних функций и ускорение генерации.
Рубль, вложенный в тестирование библиотеки, даёт сильно больше велью, чем тот же рубль, вложенный в тесты бизнес-логики. Если пренебречь тестированием, карточный домик из абстракций легко рассыпается. Давайте разберёмся, как сделать так, чтобы как можно больше домиков не сыпались.
JIT или не JIT? Вот в чём вопрос. Python — язык с многолетней историей. И на протяжении всей своей истории он не был фаворитом в вопросах производительности. Было много разных попыток приблизиться к решению этой проблемы, в том числе и с добавлением JIT (pypy, numba, etc.), но у большинства из них был фатальный недостаток. Они были инструментами для решения конкретных проблем, про которые вспоминали, только когда других вариантов уже не осталось, когда уже не жалко инвестировать дополнительное время в ускорение узкий мест и переписывание кода. Но что же нам предвещает добавление JIT в коробочную версию cpython? Мы получим бесплатное ускорение всех наших программ и возрадуемся или всё не так просто? Давайте попробуем разобраться вместе.