11.08.2020 Выпуск 347 (10.08.2020 - 16.08.2020) Статьи

Суммаризация текста: подходы, алгоритмы, рекомендации и перспективы

Ежедневно каждый из нас сталкивается с огромным информационным потоком. Нам часто необходимо изучить множество объемных текстов (статей, документов) в ограниченное время. Поэтому в области машинного обучения естественным образом родилась задача автоматического составления аннотации текста.

10.08.2020 Выпуск 347 (10.08.2020 - 16.08.2020) Статьи

Алгоритм ранжирования сегментов речной сети с использованием графов для геоинформационного анализа

В данной статье хотелось бы затронуть тему применения информационных технологий в Науках о Земле, а именно, в Гидрологии и Картографии. Под катом представлено описание алгоритма ранжирования водотоков и реализованного нами плагина для открытой геоинформационной системы QGIS.

10.08.2020 Выпуск 347 (10.08.2020 - 16.08.2020) Статьи

Может ли геймпад заменить клавиатуру? Пробуем программировать на стиках

Для печати на клавиатуре необходимо неподвижно сидеть или стоять. Геймпады, в отличие от них, портативные и компактные. Управляя ими, можно ходить по комнате или прилечь на диван.

Из-за малого количества кнопок на геймпаде никто не рассматривал их как средство ввода объёмных текстов, например, в программировании.

Однако аналоговые стики (а у большинства геймпадов их два) имеют потенциал обеспечения бесконечного количества вариантов ввода. Вопрос сводится к выбору подходящих жестов для максимальной эффективности и минимального напряжения больших пальцев.

09.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Три редко используемых возможности Python 3, о которых каждый должен знать

Python 3 существует уже какое-то время и довольно много разработчиков, особенно те, кто только начинает свой путь в Python, уже используют эту версию языка. Несмотря на то, что множество новых возможностей широко используются, похоже, что некоторые остались за кадром. В этой статье я расскажу о трех наименее известных, но полезных, возможностях. Я знаю о них из других языков и они делают Python 3 классным.

09.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Как не потерять ход времени работая за компьютером. Приложение по мониторингу работы и введению статистики

Я работаю педагогом в детском технопарке «Кванториум». В период самоизоляции мы так же, как и все перешли на дистанционное обучение. И в связи с тем, что дети стали еще больше времени проводить за компьютером, администрация решила сократить академический час и делать перерывы между работой (что бы сохранить зрение). Мы написали приложение, которое подсчитывает время, проведенное за компьютером, ведет статистику в excel (полезно для родителей) и выдает звуковое оповещение о том, что пора сделать перерыв.

09.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Мониторинг демон на Asyncio + Dependency Injector — руководство по применению dependency injection

Пошаговая инструкция по построению мониторинг демона на базе asyncio применяя принцип dependency injection.

08.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Реализация offline режима для Yandex.Music

Сегодня мы будем рассматривать такой достаточно известный музыкальный сервис, как Yandex.Music. Хороший в целом сервис, но с существенным недостатком — невозможностью работы оффлайн. Мы попробуем исправить это досадное недоразумение, используя подручные инструменты.

06.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Как работают профайлеры в Ruby и Python?

В качестве аперитива к профайлеру на Ruby я хотела рассказать о том, как работают уже существующие профайлеры на Ruby и Python. Также это поможет дать ответ на вопрос, который мне задает множество людей: «Как написать профайлер?»

07.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Рецепты uWSGI: преобразование документов с использованием LibreOffice

Для приготовления преобразования документов нам понадобится LibreOffice, uwsgi-python, pylokit и webob. Можно также воспользоваться готовым образом. Но это только для запуска uWSGI-сервера, а для подключения к uWSGI-серверу будем использовать nginx.

Самое простое uWSGI-приложение на python состоит из функции application с двумя аргументами environ и start_response

06.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Простой P2P сервер на python

Одноранговая сеть или проще P2P сеть — это сеть в которой все пользователи равны и имеют равные права. Отличительная особенность таких сетей от обычных в том, что в ней нет единого сервера, к которому подключаются пользователи, вместо этого они подключаются друг к другу. Существуют гибридные варианты таких сетей, в котором присутствует сервер, выполняющий только координирующую работу.

Сегодня я хочу предложить простой вариант реализации P2P сервера для такой сети на языке python.

05.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Дешифровка текста методом частотного анализа

В этой статье я покажу как сделать частотный анализ современного русского интернет-языка и воспользуюсь им для расшифровки текста. Кому интересно, добро пожаловать под кат!

05.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Нет времени объяснять, сделай автопилот

На выходных проходил хакасборкатон — гонки на самоуправляемых моделях автомобилей на базе комплекта donkeycar при содействии Х5 и FLESS.

Задача заключалась в следующем: сначала надо было собрать машинку из запчастей, затем ее обучить проходить трассу. Победитель определялся по самому быстрому прохождению 3 кругов. За наезд на конус — дисквалификация.

05.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Разбор статьи из журнала «Код» (Яндекс Практикум)

Недавно мне попалась статья в журнале "Код" под названием "Сравнение: классы против функций". Я прочитал ее и она показалось мне… странной. Журнал позиционирует себя как издание для начинающих программистов. Но даже со скидкой на уровень аудитории статья вызывает много вопросов.

05.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Как проанализировать рынок фотостудий с помощью Python (3/3). Аналитика

Каждый, кто открывает свой бизнес, хочет угадать идеальный момент открытия, найти идеальное место и выполнить точные, эффективные действия для того, чтобы бизнес выжил и приумножился. Найти идеальные параметры невозможно, но оценить наилучшие возможности помогают инструменты статистического анализа.

В открытых источниках содержится огромное количество полезной информации. Правильный ее сбор, хранение и анализ помогут найти оптимальные возможности для бизнеса.

04.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Стоимость строительных работ в Сан-Франциско. Инфляция и рост стоимости работ за последние 30 лет

В прошлой статье была рассмотрена общая годовая сумма строительных объемов (инвестиций) в Сан-Франциско в период с 1980 по 2018 год. По разнице между ожидаемой (сметной) и фактической (пересмотренной) стоимостью строительства отслеживались движения настроений инвесторов в периоды экономических бумов и кризисов в регионе.

03.08.2020 Выпуск 346 (03.08.2020 - 09.08.2020) Статьи

Подборка статей о машинном обучении: кейсы, гайды и исследования за июль 2020

Похоже, не один наш дайджест не обходится без упоминания разработок Open AI: в июле самой обсуждаемой темой в области машинного обучения стал новый алгоритм GPT-3. Технически это не одна модель, а целое семейство, которое для удобства обобщают под единым названием. В самой крупной модели используется 175 млрд параметров, а для обучения использовался датасет размером 570 Gb, в который вошли отфильтрованные данные из архивов Common Crawl и высококачественные данные WebText2, Books1, Books2 и Wikipedia.

02.08.2020 Выпуск 345 (27.07.2020 - 02.08.2020) Статьи

Мир без корутин. Костыли для программиста — asyncio

Тот, кто научился летать, ползать уже не будет. Но не должно быть и высокомерия к тому, кто «летать не может» в принципе. И то и другое вполне норма. И то и другое уважаемо и почетно. Для человека — это, как выбор профессии: вы, условно, либо летчик, либо шофер. Для тех же животных аналогично — вы либо орел, либо волк, т.е. либо летаете, либо бегаете (убегаете). Но только человек в своих понятиях, категориях, отношении и мыслях наделил персонажи характеристиками и выработал свое отношение к ним. Правда, с нюансами. Так, нет, наверное, почетнее и романтичнее профессии летчика, но попробуйте в этом убедить дальнобойщика или авиаконструктора?! И тут сложно возразить: космонавтов много даже сейчас, а второго Королева все еще нет!

01.08.2020 Выпуск 345 (27.07.2020 - 02.08.2020) Статьи

Тесты на pytest с генерацией отчетов в Allure с использованием Docker и Gitlab Pages и частично selenium

Этот текст предназначен для начинающих тестировщиков, желающих понять как делать отчеты на allure с историей тестов, также разъяснить где их хранить, чтобы в отчет мог заглянуть любой участник вашей команды.

31.07.2020 Выпуск 345 (27.07.2020 - 02.08.2020) Статьи

Как переписать SQL-запросы на Python с помощью Pandas

В этой статье June Tao Ching рассказал, как с помощью Pandas добиться на Python такого же результата, как в SQL-запросах. Перед вами — перевод, а оригинал вы можете найти в блоге towardsdatascience.com.

31.07.2020 Выпуск 345 (27.07.2020 - 02.08.2020) Статьи

Как проанализировать рынок фотостудий с помощью Python (2/3). База данных

В предыдущей статье в рамках коммерческого проекта по анализу рынка фотостудий рассмотрел создание парсинга: выгрузка списка фотостудий, списка залов, данных по бронированию с момента открытия зала до последней брони.

Все Только на русском Только на английском

IT-новости про Python, которые стоит знать