什么是数据分析
数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使数据分析得以推广。
数据分析是指,使用适当的统计分析方法(如聚类分析、相关分析等)对收集来的大量数据进行分析,从中提取有用信息和形成结论,并加以详细研究和概括总结的过程。
数据分析的目的在于,将隐藏在一大批看似杂乱无章的数据信息集中提炼出来有用的数据,以找出所研究对象的内在规律。在统计学领域中,数据分析可以划分为如下三类:
(1) 描述性数据分析:从一组数据中,可以摘要并且描述这份数据的集中和离散情形。
(2) 探索性数据分析:从海量数据中找出规律,并产生分析模型和研究假设。
(3) 验证性数据分析:验证科研假设测试所需的条件是否达到,以保证验证性分析的可靠性。
其中,描述性数据分析隶属于初级数据分析,常见的分析方法有对比分析法、平均分析法、交叉分析法,而探索性和验证性数据分析属于高级数据分析,常见的分析方法有相关分析、因子分析、回归分析等等。