学科分类

学科分类

前端工程师

Python工程师

大数据工程师

如何对Spark进行调优

Spark调优比较复杂，但是大体可以分为三个方面来进行优化，具体如下：

平台层面的调优：防止不必要的jar包分发，提高数据的本地性，选择高效的存储格式，如parquet。
应用程序层面的调优：过滤操作符的优化，即降低过多的小任务，降低单条记录的资源开销，处理数据倾斜，复用RDD进行缓存，作业并行化执行等等。
JVM层面的调优：设置合适的资源量，设置合理的JVM，启用高效的序列化方法如kyro，增大off head内存等。

黑马程序员教程（book.itheima.net）是一个免费的IT在线学习平台，它依托黑马程序员优质的课程资源和口碑，致力于为广大热爱IT技术的学习者和求职者提供知识共享服务。

黑马程序员教程包括学习线路图、学习教程、面试宝典三大核心板块，通过构建一个从学习到求职的良性生态圈，配套以专业的技术答疑服务，让学习更有趣，进步更明显，真正做到让学生少走弯路。

联系方式：
电话：15340145407
邮箱：itcast_book@vip.sina.com