学科分类
目录
网络爬虫

浏览器加载网页的过程

网络爬虫抓取数据的过程可以理解为模拟浏览器操作的过程,我们有必要了解浏览器浏览网页的基本过程。例如,在浏览器的地址栏输入网址“http://www.baidu.com”,按下回车键后会在浏览器中显示百度的首页。那么,这段网络访问过程中到底发生了什么?

简单来说,浏览网页的过程可分为以下四个步骤:

(1) 浏览器通过DNS服务器查找域名对应的IP地址;

(2) 向IP地址对应的Web服务器发送请求;

(3) Web服务器响应请求,发回HTML页面;

(4) 浏览器解析HTML内容,并显示出来。

浏览网页过程的示意图如图1所示。

img

图1 浏览网页的过程

点击此处
隐藏目录