首页
学习线路图
学习教程
面试宝典
首页
学习线路图
学习教程
面试宝典
学科分类
Java
前端
Python
大数据
PHP
C/C++
学科分类
Java
前端
Python
大数据
PHP
C/C++
学科分类
Java工程师
前端工程师
Python工程师
大数据工程师
PHP工程师
C/C++工程师
学科分类
学科分类
Java
前端
Python
大数据
PHP
C/C++
目录
Hadoop技术栈
Spark技术栈
Scala语言基础
初识Scala
Scala的概述
Scala的下载安装
在IDEA开发工具中下载安装Scala插件
开发第一个Scala程序
Scala的基础语法
声明值和变量
数据类型
算术和操作符重载
控制结构语句
方法和函数
Scala的数据结构
数组
元组
集合
Scala面向对象的特性
类与对象
继承
单例对象和伴生对象
特质
Scala的模式匹配与样例类
模式匹配
样例类
Spark基础
初识Spark
Spark概述
Spark的特点
Spark应用场景
Spark与Hadoop对比
搭建Spark开发环境
环境准备
Spark的部署方式
Spark集群安装部署
Spark HA集群部署
Spark运行架构与原理
基本概念
Spark集群运行架构
Spark运行基本流程
体验第一个Spark程序
启动Spark-Shell
运行Spark-Shell命令
运行Spark Shell读取HDFS文件
IDEA开发WordCount程序
本地模式执行Spark程序
集群模式执行Spark程序
Spark RDD
RDD简介
RDD的创建方式
从文件系统加载数据创建RDD
通过并行集合创建RDD
RDD的处理过程
转换算子
行动算子
编写WordCount词频统计案例
RDD的分区
RDD的依赖关系
RDD机制
持久化机制
容错机制
Spark的任务调度
DAG的概念
RDD在Spark中的运行流程
Spark SQL
Spark SQL概述
Spark SQL的简介
Spark SQL架构
DataFrame概述
DataFrame简介
DataFrame的创建
DataFrame的常用操作
Dataset概述
Dataset简介
Dataset对象的创建
RDD转换DataFrame
反射机制推断Schema
编程方式定义Schema
Spark SQL操作数据源
Spark SQL操作MySQL
操作Hive数据集
Spark Streaming
实时计算概述
什么是实时计算
常用的实时计算框架
Spark Streaming的概述
Spark Streaming简介
Spark Streaming工作原理
Spark的DStream流
DStream简介
DStream编程模型
DStream转换操作
DStream窗口操作
DStream输出操作
DStream实例——实现网站热词排序
NoSQL存储
加载中……
点击此处
隐藏目录