Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
从零学Python之入门(三)序列
May 25 Python
python开发之tkinter实现图形随鼠标移动的方法
Nov 11 Python
python模块之re正则表达式详解
Feb 03 Python
定制FileField中的上传文件名称实例
Aug 23 Python
Scrapy爬虫实例讲解_校花网
Oct 23 Python
详解Python里使用正则表达式的ASCII模式
Nov 02 Python
python根据unicode判断语言类型实例代码
Jan 17 Python
TensorFlow dataset.shuffle、batch、repeat的使用详解
Jan 21 Python
python列表删除和多重循环退出原理详解
Mar 26 Python
详解pyinstaller生成exe的闪退问题解决方案
Jun 19 Python
Python eval函数原理及用法解析
Nov 14 Python
Python模拟登录requests.Session应用详解
Nov 17 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
在任意字符集下正常显示网页的方法一
2007/04/01 PHP
PHP实现货币换算的方法
2014/11/29 PHP
PHP基于IMAP收取邮件的方法示例
2017/08/07 PHP
PHP时间函数使用详解
2019/03/21 PHP
PHP使用Http Post请求发送Json对象数据代码解析
2020/07/16 PHP
让div层随鼠标移动的实现代码 ie ff
2009/12/18 Javascript
jquery创建并行对象或者合并对象的实现代码
2012/10/10 Javascript
Javascript 拖拽的一些简单的应用(逐行分析代码,让你轻松了拖拽的原理)
2015/01/23 Javascript
浅析jquery与checkbox的checked属性的问题
2016/04/27 Javascript
JS动态添加的div点击跳转到另一页面实现代码
2017/09/30 Javascript
JS实现点击发送验证码 xx秒后重新发送功能
2019/07/30 Javascript
node命令行工具之实现项目工程自动初始化的标准流程
2019/08/12 Javascript
基于Nuxt.js项目的服务端性能优化与错误检测(容错处理)
2019/10/23 Javascript
[43:32]Winstrike vs VGJ.S 2018国际邀请赛淘汰赛BO3 第一场 8.23
2018/08/24 DOTA
python 算法 排序实现快速排序
2012/06/05 Python
Python版的文曲星猜数字游戏代码
2013/09/02 Python
Linux 发邮件磁盘空间监控(python)
2016/04/23 Python
Django实现全文检索的方法(支持中文)
2018/05/14 Python
python 控制台单行刷新,多行刷新实例
2020/02/19 Python
Django操作session 的方法
2020/03/09 Python
python 将Excel转Word的示例
2021/03/02 Python
带有css3动画效果的兼容多浏览器简单导航条示例
2014/01/26 HTML / CSS
CSS3实现10种Loading效果
2016/07/11 HTML / CSS
在线购买世界上最好的酒:BoozeBud
2018/06/07 全球购物
耐克奥地利官网:Nike奥地利
2019/08/16 全球购物
MAC彩妆澳洲官网:M·A·C AU
2021/01/17 全球购物
教师职称自我鉴定
2014/02/12 职场文书
手机被没收的检讨书
2014/10/04 职场文书
校园游戏活动新闻稿
2014/10/15 职场文书
同意离婚答辩状
2015/05/22 职场文书
超强台风观后感
2015/06/09 职场文书
运动会广播稿20字
2015/08/19 职场文书
2019年大学毕业生个人自我鉴定范文大全
2019/03/21 职场文书
为什么你写的height:100%不起作用
2021/05/10 HTML / CSS
my.ini优化mysql数据库性能的十个参数(推荐)
2021/05/26 MySQL
解决Python字典查找报Keyerror的问题
2021/05/26 Python