Собрали в одном месте самые важные ссылкии сделали Тренажер IT-инцидентов для DevOps/SRE
Хорошая статья с примером анализа узких мест, которые могут возникнуть при передачи большого объема данных на вычисления