Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 运算符 供重载参考
Jun 11 Python
python里大整数相乘相关技巧指南
Sep 12 Python
在Python中操作文件之read()方法的使用教程
May 24 Python
python logging 日志轮转文件不删除问题的解决方法
Aug 02 Python
windows下python连接oracle数据库
Jun 07 Python
Python使用Turtle模块绘制五星红旗代码示例
Dec 11 Python
python编程测试电脑开启最大线程数实例代码
Feb 09 Python
PHP实现发送和接收JSON请求
Jun 07 Python
python-tkinter之按钮的使用,开关方法
Jun 11 Python
pytorch自定义二值化网络层方式
Jan 07 Python
python opencv 实现对图像边缘扩充
Jan 19 Python
Python改变对象的字符串显示的方法
Aug 01 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
ob_start(),ob_start('ob_gzhandler')使用
2006/12/25 PHP
一个数据采集类
2007/02/14 PHP
PHP XML操作的各种方法解析(比较详细)
2010/06/17 PHP
php生成gif动画的方法
2015/11/05 PHP
windows平台中配置nginx+php环境
2015/12/06 PHP
简单的php+mysql聊天室实现方法(附源码)
2016/01/05 PHP
javascript 可以拖动的DIV(二)
2009/06/26 Javascript
firefox插件Firebug的使用教程
2010/01/02 Javascript
jQuery.Validate验证库的使用介绍
2013/04/26 Javascript
javascript检测页面是否缩放的小例子
2013/05/16 Javascript
基于jquery编写的放大镜插件
2016/03/23 Javascript
Bootstrap学习笔记之js组件(4)
2016/06/12 Javascript
Vue.js实战之Vuex的入门教程
2017/04/01 Javascript
JavaScript requestAnimationFrame动画详解
2017/09/14 Javascript
Vue前端开发规范整理(推荐)
2018/04/23 Javascript
node 使用 async 控制并发的方法
2018/05/07 Javascript
vuejs点击class变化的实例
2018/09/05 Javascript
基于vue实现移动端圆形旋钮插件效果
2018/11/28 Javascript
js模拟实现百度搜索
2020/06/28 Javascript
python编码总结(编码类型、格式、转码)
2016/07/01 Python
浅谈配置OpenCV3 + Python3的简易方法(macOS)
2018/04/02 Python
Python遍历numpy数组的实例
2018/04/04 Python
python自动发送邮件脚本
2018/06/20 Python
使用python实现滑动验证码功能
2019/08/05 Python
python 进程 进程池 进程间通信实现解析
2019/08/23 Python
python 比较2张图片的相似度的方法示例
2019/12/18 Python
jupyter notebook参数化运行python方式
2020/04/10 Python
Lulu & Georgia官方网站:购买地毯、家具、抱枕、壁纸、床上用品等
2018/03/19 全球购物
Manduka官网:瑜伽垫、瑜伽毛巾和服装
2018/07/02 全球购物
Bath & Body Works阿联酋:在线购买沐浴和身体用品
2021/02/27 全球购物
数控技术与应用毕业生自荐信
2013/09/24 职场文书
副总经理岗位职责
2014/03/16 职场文书
小学生放飞梦想演讲稿
2014/08/26 职场文书
教师批评与自我批评(群众路线)
2014/10/15 职场文书
高中班长竞选稿
2015/11/20 职场文书
教你利用python实现企业微信发送消息
2021/05/23 Python