01.05.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

What is face recognition?

01.05.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

How to set the new COEP, COOP, and CORP security headers in Django

01.05.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

Первые шаги в BI-аналитике. Роль Data Engineering

Добрый день, уважаемые читатели! Материал носит теоретический характер и адресован исключительно начинающим аналитикам, которые впервые столкнулись с BI-аналитикой.Что традиционно понимается под этим понятием? Если говорить простым языком, то это комплексная система (как и, например, бюджетирование) по сбору, обработке и анализу данных, представляющая конечные результаты в виде графиков, диаграмм, таблиц. Это требует слаженной работы сразу нескольких специалистов. Дата-инженер отвечает за хранилища и ETL/ELT-процессы, аналитик данных помогает в заполнении базы данных, аналитик BI разрабатывает управленческие панели, бизнес-аналитик упрощает коммуникации с заказчиками отчетов. Но такой вариант возможен, только если фирма готова оплачивать работу команды. В большинстве случаев небольшие компании для минимизации затрат делают ставку на одного человека, который зачастую вообще не обладает широким кругозором в области BI, а имеет лишь шапочное знакомство с платформой для отчетов. В таком случае происходит следующее: сбор, обработка и анализ данных происходит силами единственного инструмента – самой BI-платформой. При этом данные предварительно никак не очищаются, не проходят компоновки. Забор информации идет из первичных источников без участия промежуточного хранилища. Результаты такого подхода можно легко лицезреть на тематических форумах. Если постараться обобщить все вопросы касательно BI-инструментов, то в топ-3 попадут, наверное, следующие: как загрузить в систему плохо структурированные данные, как по ним рассчитать требуемые метрики, что делать, если отчет работает очень медленно. Что удивительно, на этих форумах вы практически не найдете обсуждений ETL-инструментов, описания опыта применения хранилищ данных, лучших практик программирования и запросов SQL. Более того, я неоднократно сталкивался с тем, что опытные BI-аналитики не очень лестно отзывались о применении R/Python/Scala, мотивируя это тем, что все проблемы можно решить только силами BI-платформы. Вместе с тем всем понятно, что грамотный дата инжиниринг позволяет закрывать массу проблем при построении BI-отчетности. Читать далее

01.05.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

Основы функционального программирования на Python

Этот пост служит для того, чтобы освежить в памяти, а некоторых познакомить с базовыми возможностями функционального программирования на языке Python. Материал поста разбит на четыре части:

01.05.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Вопросы и обсуждения

Talk Python to Me: #314 Ask us about modern Python projects and tools

Audio

01.05.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Релизы

gh-review-stats v0.2.0

30.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Релизы

sphinxcontrib-spelling 7.2.1

30.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Вопросы и обсуждения

The Real Python Podcast – Episode #58: Podcast Rewind With Guest Highlights for 2020-2021

30.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

Как проходит собеседование Python-разработчика: вопросы для джуниоров и мидлов

29.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

Python⇒Speed: The hidden performance overhead of Python C extensions

30.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

Полив газона с помощью модели сегментации изображений и системы на базе Arduino

Инженерная цель данного эксперимента заключалась в разработке системы из трёх частей, а именно модели сегментации изображения, скрипта управления двигателем и спринклера, работающего под управлением Arduino. Эта система должна целенаправленно поливать участки травяного газона, что позволит сэкономить значительное количество воды, а заодно и времени. Приятного чтения

29.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

Расстояние Махаланобиса

29.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

Использование геолокационных данных в машинном обучении: основные методы

Данные о местоположении — это важная категория данных, с которыми часто приходится иметь дело в проектах машинного обучения. Они, как правило, дают дополнительный контекст к данным используемого приложения. Специально к старту нового потока курса по Machine Learning, делимся с вами кратким руководством по проектированию и визуализации элементов с геопространственными данными.

29.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Статьи

Нетрадиционный анализ тональности текста: BERT vs CatBoost

Анализ тональности — это метод обработки естественного языка (NLP), используемый для определения того, являются ли данные(текст) положительными, отрицательными или нейтральными.

29.04.2021 Выпуск 384 (26.04.2021 - 02.05.2021) Вопросы и обсуждения