transformation和action算子的区别

transformation算子是得到一个新的RDD,方式很多,例如从数据源生成一个新的RDD,或者从RDD生成一个新的RDD。

action算子是得到一个值,或者一个结果(直接将RDD Cache到内存中)。

所有的transformation都是采用的懒策略,也就是说,如果只是将transformation提交是不会执行计算操作的,计算只有在action被提交的时候才被触发。

点击此处
隐藏目录