Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
wxpython 学习笔记 第一天
Mar 16 Python
Python smallseg分词用法实例分析
May 28 Python
利用TensorFlow训练简单的二分类神经网络模型的方法
Mar 05 Python
python解决字符串倒序输出的问题
Jun 25 Python
对python字典元素的添加与修改方法详解
Jul 06 Python
python3.6根据m3u8下载mp4视频
Jun 17 Python
Django 开发调试工具 Django-debug-toolbar使用详解
Jul 23 Python
python实现各种插值法(数值分析)
Jul 30 Python
使用TensorFlow直接获取处理MNIST数据方式
Feb 10 Python
python多项式拟合之np.polyfit 和 np.polyld详解
Feb 18 Python
python 使用递归实现打印一个数字的每一位示例
Feb 27 Python
用Python开发app后端有优势吗
Jun 29 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
PHP jpgraph库的配置及生成统计图表:折线图、柱状图、饼状图
2017/05/15 PHP
ThinkPHP框架使用redirect实现页面重定向的方法实例分析
2018/04/12 PHP
PHP通过文件路径获取文件名的实例代码
2018/10/14 PHP
PHP dirname简单使用代码实例
2020/11/13 PHP
IE下JS读取xml文件示例代码
2013/08/05 Javascript
JS匀速运动演示示例代码
2013/11/26 Javascript
js获得页面的高度和宽度的方法
2014/02/23 Javascript
原生js实现fadein 和 fadeout淡入淡出效果
2014/06/05 Javascript
JavaScript判断textarea值是否为空并给出相应提示
2014/09/04 Javascript
jQuery数据缓存用法分析
2015/02/20 Javascript
jQuery判断一个元素是否可见的方法
2015/06/05 Javascript
jQuery网页右侧广告跟随滚动代码分享
2020/04/20 Javascript
js仿淘宝和百度文库的评分功能
2016/05/15 Javascript
AngularJS使用带属性值的ng-app指令实现自定义模块自动加载的方法
2017/01/04 Javascript
Js实现中国公民身份证号码有效性验证实例代码
2017/05/03 Javascript
node.js连接MongoDB数据库的2种方法教程
2017/05/17 Javascript
JQuery获取元素尺寸、位置及页面滚动事件应用示例
2019/05/14 jQuery
Vue封装的组件全局注册并引用
2019/07/24 Javascript
Vue路由模块化配置的完整步骤
2019/08/14 Javascript
Vue v-bind动态绑定class实例方法
2020/01/15 Javascript
python中利用zfill方法自动给数字前面补0
2018/04/10 Python
浅谈pandas筛选出表中满足另一个表所有条件的数据方法
2019/02/08 Python
python使用thrift教程的方法示例
2019/03/21 Python
Python 忽略文件名编码的方法
2020/08/01 Python
Python SMTP发送电子邮件的示例
2020/09/23 Python
Python基于内置函数type创建新类型
2020/10/22 Python
const char*, char const*, char*const的区别是什么
2014/07/09 面试题
新三好学生主要事迹
2014/01/23 职场文书
学习经验演讲稿
2014/05/10 职场文书
事业单位考核材料
2014/05/21 职场文书
大学推普周活动总结
2015/05/07 职场文书
论文评审意见
2015/06/05 职场文书
MATLAB 如何求取离散点的曲率最大值
2021/04/16 Python
详解CSS中的特指度和层叠问题
2021/07/15 HTML / CSS
Python实现GIF动图以及视频卡通化详解
2021/12/06 Python
Go 内联优化让程序员爱不释手
2022/06/21 Golang