Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python探索之修改Python搜索路径
Oct 25 Python
pandas创建新Dataframe并添加多行的实例
Apr 08 Python
利用Python在一个文件的头部插入数据的实例
May 02 Python
python实现抖音视频批量下载
Jun 20 Python
vue.js实现输入框输入值内容实时响应变化示例
Jul 07 Python
pygame游戏之旅 载入小车图片、更新窗口
Nov 20 Python
对python中数据集划分函数StratifiedShuffleSplit的使用详解
Dec 11 Python
python实现扫描ip地址的小程序
Apr 16 Python
Python画图高斯分布的示例
Jul 10 Python
django有外键关系的两张表如何相互查找
Feb 10 Python
python实现批量修改文件名
Mar 23 Python
利用python下载scihub成文献为PDF操作
Jul 09 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
php调整gif动画图片尺寸示例代码分享
2013/12/05 PHP
PHP+Ajax无刷新带进度条图片上传示例
2017/02/08 PHP
JQUERY操作JSON实例代码
2010/02/09 Javascript
JS中for循序中延迟加载动态效果的具体实现
2013/08/18 Javascript
jQuery事件绑定和委托实例
2014/11/25 Javascript
JavaScript简介
2015/02/15 Javascript
Bootstrap打造一个左侧折叠菜单的系统模板(二)
2016/05/17 Javascript
把普通对象转换成json格式的对象的简单实例
2016/07/04 Javascript
jquery 抽奖小程序实现代码
2016/10/12 Javascript
Angularjs中使用layDate日期控件示例
2017/01/11 Javascript
jQuery表单插件ajaxForm实例详解
2017/01/17 Javascript
利用JS制作万年历的方法
2017/08/16 Javascript
zTree jQuery 树插件的使用(实例讲解)
2017/09/25 jQuery
vue-cli 3.0 自定义vue.config.js文件,多页构建的方法
2018/09/19 Javascript
vue-router命名路由和编程式路由传参讲解
2019/01/19 Javascript
JS运算符简单用法示例
2020/01/19 Javascript
[01:24]2014DOTA2 TI第二日 YYF表示这届谁赢都有可能
2014/07/11 DOTA
[35:29]Secret vs VG 2018国际邀请赛淘汰赛BO3 第三场 8.23
2018/08/24 DOTA
[01:09:16]DOTA2-DPC中国联赛 正赛 SAG vs Dynasty BO3 第一场 1月25日
2021/03/11 DOTA
python difflib模块示例讲解
2017/09/13 Python
Python断言assert的用法代码解析
2018/02/03 Python
用pandas按列合并两个文件的实例
2018/04/12 Python
删除DataFrame中值全为NaN或者包含有NaN的列或行方法
2018/11/06 Python
python3实现网络爬虫之BeautifulSoup使用详解
2018/12/19 Python
django中ORM模型常用的字段的使用方法
2019/03/05 Python
学Python 3的理由和必要性
2019/11/19 Python
Python decimal模块使用方法详解
2020/06/08 Python
jupyter notebook远程访问不了的问题解决方法
2021/01/11 Python
HTML5实现视频弹幕功能
2019/08/09 HTML / CSS
惠而浦美国官网:Whirlpool.com
2021/01/19 全球购物
2016春季校长开学典礼致辞
2015/11/26 职场文书
2016年清明节寄语
2015/12/04 职场文书
小组口号霸气押韵
2015/12/24 职场文书
15个值得收藏的JavaScript函数
2021/09/15 Javascript
Java 实战项目之家居购物商城系统详解流程
2021/11/11 Java/Android
Spring Data JPA框架的核心概念和Repository接口
2022/04/28 Java/Android