首页
学习线路图
学习教程
面试宝典
首页
学习线路图
学习教程
面试宝典
学科分类
Java
前端
Python
大数据
PHP
C/C++
学科分类
Java
前端
Python
大数据
PHP
C/C++
学科分类
Java工程师
前端工程师
Python工程师
大数据工程师
PHP工程师
C/C++工程师
学科分类
学科分类
Java
前端
Python
大数据
PHP
C/C++
目录
基础
高级
Django框架
网络爬虫
数据分析
数据分析概述
数据分析的背景
什么是数据分析
数据分析的应用场景
数据分析的流程
为什么选择Python做数据分析
创建新的Python环境—Anaconda
Anaconda发行版本概述
在Windows系统中安装Anaconda
通过Anaconda管理Python包
启用Jupyter Notebook
启动Anaconda自带的Jupyter Notebook
Jupyter Notebook界面详解
Jupyter Notebook的基本使用
常见的数据分析工具
科学计算库NumPy
认识NumPy数组对象
创建NumPy数组
ndarray对象的数据类型
查看数据类型
转换数据类型
数组运算
矢量化运算
数组广播
数组与标量间的运算
ndarray的索引和切片
整数索引和切片的基本使用
花式(数组)索引的基本使用
布尔型索引的基本使用
数组的转置和轴对称
NumPy通用函数
利用NumPy数组进行数据处理
将条件逻辑转为数组运算
数组统计运算
数组排序
检索数组元素
唯一化及其他集合逻辑
线性代数模块
随机数模块
数据分析库Pandas
Pandas的数据结构分析
Series
DataFrame
Pandas索引操作及高级索引
索引对象
重置索引
索引操作
算术运算与数据对齐
数据排序
按索引排序
按值排序
统计计算与描述
常用的统计计算
统计描述
层次化索引
认识层次化索引
层次化索引的操作
读写数据操作
读写文本文件
读写Excel文件
读取HTML表格数据
读写数据库
数据预处理
数据清洗
空值和缺失值的处理
重复值的处理
异常值的处理
更改数据类型
数据合并
轴向堆叠数据
主键合并数据
根据行索引合并数据
合并重叠数据
数据重塑
重塑层次化索引
轴向旋转
数据转换
重命名轴索引
离散化连续数据
哑变量处理类别型数据
数据分组与聚合运算
分组与聚合的原理
通过groupby()方法将数据拆分成组
数据聚合
使用内置统计方法聚合数据
面向列的聚合方法
分组级运算
数据转换
数据应用
数据可视化
数据可视化概述
什么是数据可视化
常见的图表类型
数据可视化的工具
Matplotlib—绘制图表
通过figure()函数创建画布
通过subplot()函数创建单个子图
通过subplots()函数创建多个子图
通过add_subplot()方法添加和选中子图
添加各类标签
绘制常见图表
本地保存图形
Seaborn—绘制统计图形
可视化数据的分布
用分类数据绘图
Bokeh—交互式可视化库
认识Bokeh库
通过Plotting绘制图形
时间序列分析
什么是时间序列
时间序列的基本操作
创建时间序列
通过时间戳索引选取子集
固定频率的时间序列
创建固定频率的时间序列
时间序列的频率、偏移量
时间序列的移动
时间周期及计算
创建时期对象
时期的频率转换
重采样
重采样方法(resample)
降采样
升采样
数据统计—滑动窗口
时序模型—ARIMA
文本数据分析
文本数据分析工具
NLTK与jieba概述
安装NLTK和下载语料库
jieba库的安装
文本预处理
预处理的流程
分词
词性标注
词形归一化
删除停用词
文本情感分析
文本相似度
文本分类
加载中……
点击此处
隐藏目录