Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python调用机器喇叭发出蜂鸣声(Beep)的方法
Mar 23 Python
pymongo为mongodb数据库添加索引的方法
May 11 Python
Python实现读取邮箱中的邮件功能示例【含文本及附件】
Aug 05 Python
python交互式图形编程实例(一)
Nov 17 Python
Python实现的字典值比较功能示例
Jan 08 Python
详解Python 实现元胞自动机中的生命游戏(Game of life)
Jan 27 Python
python3+PyQt5实现自定义窗口部件Counters
Apr 20 Python
pygame库实现俄罗斯方块小游戏
Oct 29 Python
python3连接kafka模块pykafka生产者简单封装代码
Dec 23 Python
python中如何使用insert函数
Jan 09 Python
Python中格式化字符串的四种实现
May 26 Python
python属于跨平台语言码
Jun 09 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
PHP 输出简单动态WAP页面
2009/06/09 PHP
PHP中PDO的错误处理
2011/09/04 PHP
SSO单点登录的PHP实现方法(Laravel框架)
2016/03/23 PHP
ZendFramework2连接数据库操作实例
2017/04/18 PHP
Js中的onblur和onfocus事件应用介绍
2013/08/27 Javascript
使用jQuery简单实现模拟浏览器搜索功能
2014/12/21 Javascript
jQuery类选择器用法实例
2014/12/23 Javascript
jQuery的context属性用法实例
2014/12/27 Javascript
一看就懂:jsonp详解
2015/06/01 Javascript
jQuery对html元素的取值与赋值实例详解
2015/12/18 Javascript
详解AngularJS过滤器的使用
2016/03/11 Javascript
AngularJS在IE8的不支持的解决方法
2016/05/13 Javascript
Vue非父子组件通信详解
2017/06/12 Javascript
深入浅析javascript继承体系
2017/10/23 Javascript
Vue 监听列表item渲染事件方法
2018/09/06 Javascript
微信小程序实现多选功能
2018/11/04 Javascript
socket在egg中的使用实例代码详解
2019/05/30 Javascript
uni-app 自定义底部导航栏的实现
2020/12/11 Javascript
python调用百度语音REST API
2018/08/30 Python
解决Pycharm运行时找不到文件的问题
2018/10/29 Python
解决pyinstaller打包exe文件出现命令窗口一闪而过的问题
2018/10/31 Python
详解opencv Python特征检测及K-最近邻匹配
2019/01/21 Python
django queryset相加和筛选教程
2020/05/18 Python
python3中确保枚举值代码分析
2020/12/02 Python
Pycharm制作搞怪弹窗的实现代码
2021/02/19 Python
Django实现简单的分页功能
2021/02/22 Python
Django后端按照日期查询的方法教程
2021/02/28 Python
canvas需要在标签里直接定义宽高
2014/12/17 HTML / CSS
Mytheresa英国官网:拥有160多个奢侈品品牌
2016/10/09 全球购物
简历中个人自我评价分享
2014/03/15 职场文书
4s店市场专员岗位职责
2014/04/09 职场文书
禁止高声喧哗的标语
2014/06/11 职场文书
高中物理教学反思
2016/02/19 职场文书
情况说明书格式及范文
2019/06/24 职场文书
导游词之潮音寺
2019/09/26 职场文书
SpringBoot整合minio快速入门教程(代码示例)
2022/04/03 Java/Android