学科分类
目录
网络爬虫

selenium和PhantomJS安装配置

要想使用selenium和PhantomJS,前提是需要在电脑上进行安装配置,具体如下。

1. Selenium下载和安装

Selenium的下载和安装有两种方式。

第一种方式是手动从PyPI网站下载Selenium库然后安装。下载地址是:https://pypi.python.org/simple/selenium/,如图1所示。

img

图1 Windows系统支持的可用版本

下载最新版的selenium-2.21.2.tar.gz安装包到本地,然后解压缩(在Windows系统下,假设解压缩到E盘)。

打开终端来到解压后的setup.py文件所在目录(例如Windows系统下,E:\selenium-2.21.2),使用如下命令安装即可。

python setup.py install

第二种方式是直接使用第三方管理器pip命令自动安装。例如,在Windows终端输入以下命令即可:

pip install selenium

2. PhantomJS下载和配置

输入网址https://bitbucket.org/ariya/phantomjs/downloads/,可以看到PhantomJS的官网下载页面,选择自己电脑对应的版本下载即可。例如,点击对应Windows系统的phantomjs-2.1.1-windows.zip并进行下载,如图2所示。

img

图2 下载PhantomJS

下载到本地后,解压缩即可。

然后对PhantomJS进行配置,只需要将文件夹目录放入系统环境变量中。步骤如下:

(1)点击【计算机】->【属性】->【高级系统设置】,进入系统属性界面。然后点击【高级】->【环境变量】,如图3所示。

img

图3 找到“环境变量”

(2)在“系统变量”里找到Path,点击“编辑...”按钮,如图4所示。

img

图4 编辑Path

(3)然后在变量值里添加phantomjs.exe文件所在的目录,例如,本书中将PhantomJS解压到D盘,那么使用的是D:\phantomjs-2.1.1-windows\bin目录,如图5所示。

img

图5 添加PhantomJS路径到Path变量

如果不对PhantomJS进行配置,不将它的目录添加到系统路径,其实也可以在代码里使用,只需要显式地指定phantomjs.exe文件所在的目录即可。但是这种方式使用相对麻烦,我们推荐使用第一种方法,即添加到环境变量中,这样在代码里就不用理会phantomjs.exe文件在哪个位置了。

点击此处
隐藏目录