15.07.2021 Выпуск 395 (12.07.2021 - 18.07.2021) Статьи

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch Часть3

В этом третьем посте о моделях sequence-to-sequence с использованием PyTorch и torchText мы будем реализовывать модель из стать Neural Machine Translation by Jointly Learning to Align and Translate. Эта модель демонстрирует лучшую точность из из трёх моделей (~27 по сравнению с ~34 у предыдущей модели).

14.07.2021 Выпуск 395 (12.07.2021 - 18.07.2021) Статьи

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 2)

Во втором разделе туториола о моделях sequence-to-sequence с использованием PyTorch и TorchText мы будем реализовывать модель из работы Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Эта нейронная сеть позволит достичь лучшей точности при использовании только однослойной RNN как в кодере, так и в декодере.

13.07.2021 Выпуск 395 (12.07.2021 - 18.07.2021) Статьи

Как контейнеризировать среды ML разработки и не посадить на мель процессы MLOps

Проблема эффективного создания продуктов на базе Machine Learning в бизнесе не ограничивается подготовкой данных, разработкой и обучением нейросети или другого алгоритма. На итоговый результат влияют такие факторы, как: процессы верификации датасетов, организованные процессы тестирования, и размещение моделей в виде надежных Big Data приложений.

13.07.2021 Выпуск 395 (12.07.2021 - 18.07.2021) Статьи

Эксперимент для сотрудника с нарушением слуха, ч. 2, проверка на себе

В первой части мы рассказали, зачем вообще решили заняться этим вопросом, а также поделились переводом статьи, ставшей для нас отправной точкой для собственных изысканий. Теперь хотим рассказать, как мы доработали идею под нашего сотрудника.

Отдельное спасибо комментаторам, которые отметились в комментариях к первой части. Устройства с костной проводимостью, программные решения вроде Equalizer APO 1.2.1, слуховые устройства с поддержкой Bluetooth — мы собрали и передали все ваши идеи. Может быть, что-то из этого и выйдет. Но мы расскажем о своём варианте. Возможно, он тоже кому-то будет полезен.

12.07.2021 Выпуск 395 (12.07.2021 - 18.07.2021) Статьи

[recovery mode] Slicer: нарезка твердотельных объектов под раскрой

Красивая фэшн мебель, предметы роскоши и модный лухари интерьер - это то, что позволяет пустить пыль в глаза вашим гостям и прослыть хозяевам интересными людьми. Но как все это раздобыть, если у вас ипотека и бюджет ограничен?

11.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 1)

Этот туториал содержит материалы полезные для понимания работы глубоких нейронных сетей sequence-to-sequence (seq2seq) и реализации этих моделей с помощью PyTorch 1.8, torchtext 0.9 и spaCy 3.0, под Python 3.8. Материалы расположены в эволюционном порядке: от простой и неточной модели к сложной и обладающей наибольшей точностью.

11.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Как новый метод упаковки в BERT ускоряет обработку естественного языка в 2 раза

Используя новый алгоритм упаковки, в Graphcore ускорили обработку естественного языка более чем в 2 раза при обучении BERT-Large. Метод упаковки удаляет заполнение, что позволяет значительно повысить эффективность вычислений. В Graphcore предполагают, что это также может применяться в геномике, в моделях фолдинга белков и других моделях с перекошенным распределением длины, оказывая гораздо более широкое влияние на различные отрасли и приложения. В новой работе Graphcore представили высокоэффективный алгоритм гистограммной упаковки с неотрицательными наименьшими квадратами (или NNLSHP), а также алгоритм BERT, применяемый к упакованным последовательностям. К старту курса о машинном и глубоком обучении представляем перевод обзора соответствующей публикации на ArXiv от её авторов. Ссылку на репозиторий вы найдёте в конце статьи.

09.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Алгебраические типы данных и Python

09.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Оптимизация на простых типах данных. Часть №2 «Числа»

09.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Десктопизация по-питоновски. Инструменты для создания автотестов

Автоматизация тестирования – неотъемлемая часть процесса обеспечения качества. Мы в нашей практике чаще всего разрабатываем тесты для веб-, мобильных приложений и API, но сегодня хотим рассказать о более редком направлении – тестировании десктоп-приложений.

08.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Безопасный ввод и сохранение зашифрованных паролей в конфигах Linux: пишем скрипт на Python

В условиях растущих требований к безопасности создание и хранение паролей может вызвать вопросы не только для пользователей, но и у разработчиков и системных администраторов. Специалисты и другие осведомлённые люди знают, что пароли нужно хранить в зашифрованном виде. Уже на этапе ввода символы пароля нужно скрывать от любых глаз (даже от того человека, который его вводит). Всегда ли мы можем выполнить хотя бы эти требования?

08.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Книга «Python, например»

Python — стремительно развивающийся язык программирования современности. В этом увлекательном и необычном руководстве материал разбивается на доступные пошаговые фрагменты, а теория объясняется кратко и понятно. Вместо того чтобы обрушивать на читателя лавину технического жаргона, вгоняющего в ступор, эта книга предлагает ему поработать над 150 практическими задачами. Создавая программы для решения этих задач, читатель быстро перейдет от азов к уверенному использованию сопрограмм, графического пользовательского интерфейса и к работе с внешними файлами — текстовыми, в формате .csv и базами данных SQL. Книга идеально подойдет каждому, кто хочет освоить программирование на Python. В частности студенты, изучающие computer science, и преподаватели, которые хотят более уверенно овладеть Python, найдут в книге подборку готовых задач для использования на учебных
курсах.

08.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Оптимизация на простых типах данных

08.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Роль обратного распределения в построении нейросети

Обратное распространение — это способ обучения нейронной сети. Цели обратного распространения просты: отрегулировать каждый вес пропорционально тому, насколько он способствует общей ошибке. Если мы будем итеративно уменьшать ошибку каждого веса, в конце концов у нас будет ряд весов, которые дают хорошие прогнозы.

07.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Диаграмма Сэнкей (Sankey diagram) на Python

В моей работе часто возникают различные задачи по анализу консистентности и полноты данных, а также по визуализации. Одна из таких задач, которую решал относительно недавно - необходимость визуализировать действия пользователей нашего мобильного приложения. Нужно было понять, какие сценарии работы с приложением существуют и внимательнее рассмотреть действия пользователей на каждом шаге для дальнейшего улучшения стабильности работы приложения.

07.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Четыре проекта с веб-скрейпингом, которые позволят упростить себе жизнь

07.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Видео

Moscow Python Podcast. Переход с Flask на FastAPI (level: all)

В гостях у Moscow Python Podcast CTO и со-основатель компании Datafold Александр Морозов. Обсудили с Александром причины перехода его стартапа с Flask на FastAPI.

07.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Аннотирование текстов при помощи BERT

BERT тюнится под множество задач и доменов. В спектр задач, которые можно решить при помощи трансформера, входит задача аннотирования – краткого пересказа текстов. В статье подробно расскажем о том, как нужно модифицировать инструмент, чтобы обучить модель экстрактивной суммаризации.

06.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Реализация алгоритма Минимакс на примере игры «Крестики-Нолики»

Недавно я написал непобедимую игру «Крестики-Нолики». Это был интересный и поучительный проект, который многому меня научил. Если у вас есть желание посмотреть результат — это можно сделать здесь.

06.07.2021 Выпуск 394 (05.07.2021 - 11.07.2021) Статьи

Лампа для слежения за фазами Луны на Raspberry Pi и Python

Лампа для слежения за фазами Луны, об изготовлении которой я хочу рассказать, это — развитие моего проекта лампы, воспроизводящей восход Солнца, которую я сделал для того, чтобы убедить сына в том, что день не начинается в 5 часов утра.

Все Только на русском Только на английском

IT-новости про Python, которые стоит знать