Собрали в одном месте самые важные ссылки
читайте авторский блог
Одна из типовых задач аналитика — посчитать что-то на pySpark, а потом выгрузить это. Например: маленькую табличку в экселе, чтобы сделать отчёт или презентацию; большую таблицу в экселе или csv, чтобы отправить коллегам — до нескольких Гб; большой датасет для обучения ML-модели — до 100 Гб.