https://www.passeidireto.com/pergunta/122799889/como-o-spark-agiliza-a-execucao-de-tarefas-sobre-o-mesmo-conjunto-de-dados-obten
Recomendo esse arquivo que achei no Passei Direto