Собрали в одном месте самые важные ссылкичитайте авторский блог
Статья описывает как с использованием sklearn извлекать фичи из текста