什么是数据可视化
通常,大部分数据是以文本或数值的形式显示的,它们不仅无法很好地展示数据之间的关系和规律,而且给人十分枯燥的感觉。因此,我们可以借用一些图形工具,采用更直观的方式传达与沟通信息,正如那句“字不如表,表不如图”所言。由此可见,数据可视化对于数据分析而言是很有必要的。Python中提供了一些数据可视化的工具,比如Matplotlib、Seaborn、Bokeh等。
数据可视化是指将数据以图表的形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程,具体如图1所示。
图1 数据可视化的过程
原始数据经过标准化、结构化处理之后,将数据转换成数据表,然后使用一些视觉结构(比如形状、位置、色彩、尺寸、方向等)的方式映射表格中的数值,最后把这些视觉结构进行组合,转换成图形传递给用户查看,使用户更好地理解这些数据背后存在的问题与规律。
数据可视化旨在借助图形化手段,清晰有效地将数据中的各种属性和变量呈现出来,使用户可以从不同的维度观察数据,从而对数据进行更深入地观察和分析。