IT-новости про Python, которые стоит знать

Собрали в одном месте самые важные ссылки
читайте авторский блог

     17.08.2020       Выпуск 348 (17.08.2020 - 23.08.2020)       Статьи

Распознавание мяча в волейболе с OpenCV и Tensorflow

После первого опыта распознавания спортивных движений у меня зачесались руки сделать что-нибудь еще в этом направлении. Домашняя физкультура уже казалась слишком мелкой целью, так что я замахнулся на игровые виды спорта.

     16.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Конфуций и Маргарита

Соревнований по машинному обучению как и платформ, на которых они проводятся, существует немало и на любой вкус. Но не так часто темой контеста является человеческий язык и его обработка, еще реже такое соревнование связано с русским языком. Недавно я принимал участие в соревновании по машинному переводу с китайского на русский, прошедшего на платформе ML Boot Camp от Mail.ru. Не обладая большим опытом в соревновательном программировании, и проведя, благодаря карантину, все майские праздники дома, удалось занять первое место. Про это, а также про языки и подмену одной задачи другой я постараюсь рассказать в статье.

     16.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

VKWave — фреймворк для разработки ботов ВКонтакте

Сегодня я хочу рассказать о замечательной библиотеке для разработке ботов ВКонтакте с помощью языка программирования Python.

     16.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Первые шаги в визуализации данных с использованием Geopandas и OSM

У многих хоть раз возникала необходимость быстро нарисовать карту города или страны, нанеся на нее свои данные (точки, маршруты, тепловые карты и т.д.).
Как быстро решить такую задачу, откуда взять карту города или страны для отрисовки — в подробной инструкции под катом.

     16.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

pyOpenRPA туториал. Управление WEB приложениями

Долгожданный туториал по управлению сторонними WEB приложениями с помощью pyOpenRPA. Во 2-й части мы разберем принципы роботизированного воздействия на HTML/JS. А также своими руками сделаем небольшого, но очень показательного робота.

Этот робот будет полезен тем, для кого актуальна тема покупки/продажи недвижимости.

     15.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Попытка определить язык манускрипта Войнича, Random Forest Classifier

Пытаемся определить язык таинственной рукописи — манускрипта Войнича — простыми методами обработки естественных языков на Python.

     14.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Визуализация статистики Яндекс Директ своими руками. От API до Data Studio

Мне, как специалисту по рекламе, требуется постоянно присматривать за клиентами. В этом мне помогает Data Studio.
Однако специалистам по рекламе редко выделяют бюджеты на аналитику, поэтому приходится делать все своими руками.

     14.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Калькулятор Wolframalpha в диалоге Telegram

В диалогах телеграма я очень часто использую телеграм бот: inlatexbot. Он позволяет вставлять Latex прямо в диалоге телеграма — это удобно: математическое обозначение можно отправить понятной картинкой.

Но не менее часто, мне в телеграме необходим функционал WolframAlpha: посчитать сложный счет за вечеринку с друзьями, различные проценты, решить уравнение и так далее — полный функционал WolframAlpha, но при этом не выходить из диалога телеграма.

     14.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Создание голосового ассистента на Python, часть 1

Наверное, все смотрели фильмы про железного человека и хотели себе голосового помощника, похожего на Джарвиса. В этом посте я расскажу, как сделать такого ассистента с нуля. Моя программа будет написана на python 3 в операционной системе windows. Итак, поехали!

     14.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

CLI приложение + Dependency Injector — руководство по применению dependency injection + Вопросы / ответы

Пошаговая инструкция по построению CLI приложения применяя принцип dependency injection. Это завершающее руководство этой серии. В качестве бонуса: ответы на часто задаваемые вопросы о dependency injection.

     13.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Обзор методов создания эмбедингов предложений, Часть2

Здравствуйте, продолжение статьи про методы создания эмбедингов предложений. В этом гайде мало слов и много кода, готово для Ctrl+с, Ctrl+v, улучшений и дальнейших тестов.

     13.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Обзор методов создания эмбедингов предложений, Часть 1

Представте себе, как было бы удобно, написать предложение и найти похожее к нему по смыслу. Для этого нужно уметь векторизовать всё предложение, что может быть очень не тривиальной задачей.

 

По специфике своей работы, я должен искать похожие запросы в службу поддержки и даже имея достаточно большую разметку, бывает тяжело собрать необходимое количество сообщений подходящих по тематике, но написанных другими словами.

Ниже обзорное исследование на способы векторизации всего предложения и не просто векторизации, а попытка векторизовать предложение с учётом его смысла.

     12.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Выявляем признаки аудиомонтажа методами AI

Одной из задач фоноскопической экспертизы является установление подлинности и аутентичности аудио записи — другими словами, выявление признаков монтажа, искажения и изменения записи. У нас возникла задача её проведения в целях установления подлинности записей – определения того, что на записи не осуществлялось никаких воздействий. Но как провести анализ тысяч, и даже сотен тысяч аудиозаписей?

     11.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Суммаризация текста: подходы, алгоритмы, рекомендации и перспективы

Ежедневно каждый из нас сталкивается с огромным информационным потоком. Нам часто необходимо изучить множество объемных текстов (статей, документов) в ограниченное время. Поэтому в области машинного обучения естественным образом родилась задача автоматического составления аннотации текста.

     10.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Алгоритм ранжирования сегментов речной сети с использованием графов для геоинформационного анализа

В данной статье хотелось бы затронуть тему применения информационных технологий в Науках о Земле, а именно, в Гидрологии и Картографии. Под катом представлено описание алгоритма ранжирования водотоков и реализованного нами плагина для открытой геоинформационной системы QGIS.

     10.08.2020       Выпуск 347 (10.08.2020 - 16.08.2020)       Статьи

Может ли геймпад заменить клавиатуру? Пробуем программировать на стиках

Для печати на клавиатуре необходимо неподвижно сидеть или стоять. Геймпады, в отличие от них, портативные и компактные. Управляя ими, можно ходить по комнате или прилечь на диван.

Из-за малого количества кнопок на геймпаде никто не рассматривал их как средство ввода объёмных текстов, например, в программировании.

Однако аналоговые стики (а у большинства геймпадов их два) имеют потенциал обеспечения бесконечного количества вариантов ввода. Вопрос сводится к выбору подходящих жестов для максимальной эффективности и минимального напряжения больших пальцев.

     09.08.2020       Выпуск 346 (03.08.2020 - 09.08.2020)       Статьи

Три редко используемых возможности Python 3, о которых каждый должен знать

Python 3 существует уже какое-то время и довольно много разработчиков, особенно те, кто только начинает свой путь в Python, уже используют эту версию языка. Несмотря на то, что множество новых возможностей широко используются, похоже, что некоторые остались за кадром. В этой статье я расскажу о трех наименее известных, но полезных, возможностях. Я знаю о них из других языков и они делают Python 3 классным.

     09.08.2020       Выпуск 346 (03.08.2020 - 09.08.2020)       Статьи

Как не потерять ход времени работая за компьютером. Приложение по мониторингу работы и введению статистики

Я работаю педагогом в детском технопарке «Кванториум». В период самоизоляции мы так же, как и все перешли на дистанционное обучение. И в связи с тем, что дети стали еще больше времени проводить за компьютером, администрация решила сократить академический час и делать перерывы между работой (что бы сохранить зрение). Мы написали приложение, которое подсчитывает время, проведенное за компьютером, ведет статистику в excel (полезно для родителей) и выдает звуковое оповещение о том, что пора сделать перерыв.