Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
MySQLdb ImportError: libmysqlclient.so.18解决方法
Aug 21 Python
Python 中urls.py:URL dispatcher(路由配置文件)详解
Mar 24 Python
Python爬虫获取整个站点中的所有外部链接代码示例
Dec 26 Python
pyQt4实现俄罗斯方块游戏
Jun 26 Python
tensorflow使用神经网络实现mnist分类
Sep 08 Python
python pyinstaller打包exe报错的解决方法
Nov 02 Python
Python基于codecs模块实现文件读写案例解析
May 11 Python
python3 使用openpyxl将mysql数据写入xlsx的操作
May 15 Python
Python 分布式缓存之Reids数据类型操作详解
Jun 24 Python
详解在Python中使用Torchmoji将文本转换为表情符号
Jul 27 Python
PyCharm设置注释字体颜色以及是否倾斜的操作
Sep 16 Python
LeetCode189轮转数组python示例
Aug 05 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
php中使用in_array() foreach array_search() 查找数组是否包含时的性能对比
2015/04/14 PHP
PHP读书笔记整理_结构语句详解
2016/07/01 PHP
深入解析PHP中SESSION反序列化机制
2017/03/01 PHP
PHP实现防盗链的方法分析
2017/07/25 PHP
PHP使用mysqli同时执行多条sql查询语句的实例
2019/03/22 PHP
javascript编程起步(第三课)
2007/02/27 Javascript
Jquery 点击按钮显示和隐藏层的代码
2011/07/25 Javascript
JQuery中serialize()、serializeArray()和param()方法示例介绍
2014/07/31 Javascript
Js使用WScript.Shell对象执行.bat文件和cmd命令
2014/12/18 Javascript
JS实现网页顶部向下滑出的全国城市切换导航效果
2015/08/22 Javascript
关于JS中的apply,call,bind的深入解析
2016/04/05 Javascript
js类式继承与原型式继承详解
2016/04/07 Javascript
用jQuery实现优酷首页轮播图
2017/01/09 Javascript
vue+socket.io+express+mongodb 实现简易多房间在线群聊示例
2017/10/21 Javascript
Node.js实现发送邮件功能
2017/11/06 Javascript
vue-cli2打包前和打包后的css前缀不一致的问题解决
2018/08/24 Javascript
Vue自定义指令上报Google Analytics事件统计的方法
2019/02/25 Javascript
js实现轮播图特效
2020/05/28 Javascript
vue中axios封装使用的完整教程
2021/03/03 Vue.js
一个基于flask的web应用诞生(1)
2017/04/11 Python
Python判断文件或文件夹是否存在的三种方法
2017/07/27 Python
HTML5实现动画效果的方式汇总
2016/02/29 HTML / CSS
浅谈html5标签css3的常用样式
2016/10/20 HTML / CSS
野兽派官方旗舰店:THE BEAST 野兽派
2016/08/05 全球购物
20世纪40年代连衣裙和复古服装:The Seamstress Of Bloomsbury
2018/07/24 全球购物
Intersport西班牙:在线体育商店
2019/11/06 全球购物
俄罗斯达美乐比萨外送服务:Domino’s Pizza
2020/12/18 全球购物
介绍下Java的输入输出流
2014/01/22 面试题
幼儿园中秋节活动反思
2014/02/16 职场文书
群众路线教育党课主持词
2014/04/01 职场文书
租房协议书范本
2014/04/09 职场文书
新课培训心得体会
2014/09/03 职场文书
“三支一扶”支教教师思想汇报
2014/09/13 职场文书
买房协议书范本
2014/10/23 职场文书
学校拾金不昧表扬信
2015/01/16 职场文书
linux下导入、导出mysql数据库命令的实现方法
2021/05/26 MySQL