22.03.2021 Выпуск 379 (22.03.2021 - 28.03.2021) Статьи

Студенты, лабы и python: обработка данных

В своей предыдущей заметке на тему обработки данных лабораторных работ я написал об использовании пакета gnuplot – простого и мощного инструмента для решения подобных задач и графического представления результатов. Однако довольно распространённым является мнение, что студенты, которым я советовал использовать gnuplot, вероятно, изучают программирование и способы визуализации данных, и что для них более естественным и полезным будет практическое применение уже полученных навыков в этой сфере. В этом коротком тексте мы рассмотрим применение python с использованием библиотек scipy для обработки данных и matplotlib для представления результатов.

21.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Ещё один поиск Вк по фото

Я люблю ввязываться в авантюры, и за последний месяц об одной из них я пару раз рассказывал друзьям, что вызывало восторг, поэтому решил поделиться с хабравчанами! Эта история про отважные пет-проекты, мощь опен-сорса и саморазвитие, а также основные технические детали. Надеюсь, вас это вдохновит.

19.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Pattern matching. Теперь и в Python

В юбилейный минор третьего питона наконец-то завезли pattern matching. Саму концепцию сложно назвать новой, она уже реализована во многих языках, причём как нового поколения (Rust, Golang), так и у тех, кому уже за 0x18 (Java).

19.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Поиск нарушений на видео с помощью компьютерного зрения

Автоматизация обработки видеозаписи с целью выявления нарушений — одно из востребованных направлений компьютерного зрения во многих отраслях.
Сегодня мы попытаемся обнаружить на видео отсутствие клиента в кадре в момент проведения операции в автоматизированной системе.

19.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Однажды Microsoft забанила всю мою страну за читерство

Club Bing — это набор игр, в которые можно было играть в 2007-2012 годах. Все игры были связаны со словами, в них нужно было играть онлайн, чтобы зарабатывать очки, которые можно было тратить в онлайн-магазине для покупки призов. Одна из игр называлась Chicktionary. Цель игры: использовать 7 букв, чтобы составить как можно больше слов.

18.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Поддержка токенов PKCS#11 с ГОСТ-криптографией в Python. Часть II — Объекты класса Token

В предыдущей статье был представлен модуль pyp11, написанный на языке Си и обеспечивающий поддержку токенов PKCS#11 с российской криптографией. В этой статье будет рассмотрен класс Token, который позволит упростить использование функционала модуля pyp11 в скриптах, написанных на Python-е. Отметим, что в качестве прототипа этого класса был взят класс token, написанный на TclOO и который используется в утилите cryptoarmpkcs

18.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Создание образа Мона Лизы в Игре «Жизнь»

Клеточные автоматы представляют большой интерес и являются предметом исследования во многих областях, включая математику, физику, биологию, программирование и прочие. В статье мы разберем базовую реализацию и оптимизацию алгоритма для поиска состояния Жизни, из которого в течение нескольких поколений будет генерироваться образ Мона Лизы.

18.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Сэмплирование Томпсона

Маленький Робот потерялся в торговом центре. С помощью обучения с подкреплением мы хотим помочь ему найти свою маму. Но прежде чем он начнёт её искать, ему нужно подзарядиться от набора розеток, каждая из которых даёт разное количество энергии.С помощью стратегий из задачи про многорукого бандита нам нужно найти лучшую розетку в кратчайшие сроки, чтобы Маленький Робот подзарядился и отправился в путь. Сэмплирование Томпсона — это один из самых сложных и интересных способов решения задачи «многорукого бандита».

18.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Как юристы на kad.arbitr клиентов искали

Идея родилась несколько лет назад и была до банальности проста: kad.arbitr.ru - сайт, где "живут" гражданские и иные дела - просто бездонный кладезь ценной информации для юридической фирмы. В материалах дел должны быть компании, которым предъявили иск и которые еще не знают об этом, не готовы, не могут или не хотят сами ходить в суды. Осталось только найти эти фирмы и достучаться до них.

Сказано - сделано. Вооружившись python и базовыми знаниями его синтаксиса, пара юристов решили выяснить, что из этого получится.

17.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Масштабируемый Продакшн-реди Телеграм бот на Django

На Хабре очень много статей о том, как создать простейшего Телеграм бота с кнопками меню и логикой, есть инструкции, как это все задеплоить. В этой статье я расскажу, как делать ботов для продакшена, которыми смогут пользоваться сотни тысяч пользователей.

17.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

NLP: выделяем факты из текста с помощью Томита-парсера

Большая часть данных в мире не структурирована – это просто тексты на русском или на любом другом языке. Извлеченные факты из таких текстов могут представлять особый интерес для бизнеса, поэтому подобные задачи возникают сплошь и рядом. Этим вопросом занимается отдельное направление искусственного интеллекта: обработка естественного языка, тот самый NLP (Natural Language Processing).

16.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Градиентный спуск в Python

Основная цель - создать алгоритм, который найдет максимальное значение по модулю минимума на заданном радиусе.
Алгоритм должен быть эффективным и работать достаточно быстро
Результат должен быть отображен на графике

16.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Как мы обучили нейросеть поздравлять женщин с 8 марта

В честь 8 марта мы запустили сервис поздравлений, в основе которого нейросеть. Любой желающий может воспользоваться им, чтобы сгенерировать уникальное изображение цветка и текст поздравления.

За несколько дней в преддверии международного женского дня сервисом воспользовалось две с половиной тысячи уникальных пользователей. Всего было сгенерировано почти семь тысяч открыток. В этой публикации мы расскажем об особенностях реализации проекта. Материал будет полезен всем, кто интересуется темой машинного обучения.

16.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

Как сделать трансформер чат-бот на Trax?

Экспериментировать с библиотекой Trax и архитектурой трансформер оказалось крайне увлекательно. Предыдущая статья была про саммаризатор. В этой хочу рассказать о том, как я учил трансформер общаться на русском языке.

15.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

OpenCV в Python. Часть 4

В этой статье я бы хотел рассказать как с помощью только OpenCV распознавать объекты, на примере игральных карт

15.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Видео

Python-стрим. Как становятся джунами в британской компании на удалёнке

В очередном Python-стриме мы поговорим с выпускниками курсов Learn Python Тим Одинцовым и Екатериной Поповой, которые недавно стали разработчиками в компании Zipsale. Обсудим, каким был их путь в IT и каково это работать в британской компании джуном на удалёнке.

15.03.2021 Выпуск 378 (15.03.2021 - 21.03.2021) Статьи

[Перевод] Визуализируйте многопоточные программы Python с open source инструментом – VizTracer

VizTracer – инструмент отслеживания и визуализации написанных на Python программ, который помогает логировать, отлаживать и профилировать код. Хотя он хорошо работает в однопоточных программах с одной задачей, польза от него в смысле конкурентных программ делает инструмент уникальным.

14.03.2021 Выпуск 377 (08.03.2021 - 14.03.2021) Статьи

C и Python: мост между мирами

Вам интересно подключить всю мощь Python в свою программу на C? Отлично: в статье содержится минимальный крэш-курс по подключению интерпретатора Python, загрузке своего кода и взаимодействию с ним из программы на C.

13.03.2021 Выпуск 377 (08.03.2021 - 14.03.2021) Статьи

Tesseract vs таблицы. Распознавание документов

Несмотря на цифровизацию всего и вся, во время когда человечество стоит на пороге создания нейроинтерфейса, когда ИИ стало обыденностью, классическая задача получения данных со скана/картинки до сих пор актуальна.

13.03.2021 Выпуск 377 (08.03.2021 - 14.03.2021) Статьи

Играем с CLIP. Создаем универсальный zero-shot классификатор на Android

Эта статья является дополненной и сильно расширенной версией моей статьи в TowardsDataScience о создании приложения, использующем новейшую мультимодальную нейросеть от OpenAI

Все Только на русском Только на английском

IT-новости про Python, которые стоит знать