学科分类
目录
网络爬虫

网页数据格式

对于服务器端来说,它返回给客户端的数据格式可分为非结构化和结构化两种。

那么,什么是非结构化数据?什么是结构化数据呢?

非结构化数据是指数据结构不规则或不完整,没有预定义的数据模型,不方便使用数据库二维逻辑来表现的数据,包括所有格式的办公文档、文本、图像等。

结构化数据就是能够用数据或统一的结构加以表示,具有模式的数据,包括HTML、XML和JSON等。

点击此处
隐藏目录