Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python字符转换
Sep 06 Python
Python 字符串中的字符倒转
Sep 06 Python
在Python中封装GObject模块进行图形化程序编程的教程
Apr 14 Python
以视频爬取实例讲解Python爬虫神器Beautiful Soup用法
Jan 20 Python
Python网络编程之TCP与UDP协议套接字用法示例
Feb 02 Python
Python实现将json文件中向量写入Excel的方法
Mar 26 Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 Python
TensorFlow 显存使用机制详解
Feb 03 Python
win10从零安装配置pytorch全过程图文详解
May 08 Python
哪种Python框架适合你?简单介绍几种主流Python框架
Aug 04 Python
Python用摘要算法生成token及检验token的示例代码
Dec 01 Python
python turtle绘图
May 04 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
destoon实现VIP排名一直在前面排序的方法
2014/08/21 PHP
php页面,mysql数据库转utf-8乱码,utf-8编码问题总结
2015/08/27 PHP
laravel-admin 中列表筛选方法
2019/10/03 PHP
Thinkphp框架使用list_to_tree 实现无限级分类列出所有节点示例
2020/04/04 PHP
JS版网站风格切换实例代码
2008/10/06 Javascript
javascript中关于执行环境的杂谈
2011/08/14 Javascript
JS在TextArea光标位置插入文字并实现移动光标到文字末尾
2013/06/21 Javascript
javascript实现的平方米、亩、公顷单位换算小程序
2014/08/11 Javascript
js实现交换运动效果的方法
2015/04/10 Javascript
jquery控制页面部分刷新的方法
2015/06/24 Javascript
高效Web开发的10个jQuery代码片段
2016/07/22 Javascript
微信小程序上滑加载下拉刷新(onscrollLower)分批加载数据(二)
2017/05/11 Javascript
vue.js中mint-ui框架的使用方法
2017/05/12 Javascript
AngularJS中使用ngModal模态框实例
2017/05/27 Javascript
bootstrap下拉框动态赋值方法
2018/08/10 Javascript
详解小程序rich-text对富文本支持方案
2018/11/28 Javascript
vue+moment实现倒计时效果
2019/08/26 Javascript
Vue Element校验validate的实例
2020/09/21 Javascript
[32:47]完美世界DOTA2联赛 GXR vs IO 第二场 11.07
2020/11/09 DOTA
Python下载指定页面上图片的方法
2016/05/12 Python
Python类属性的延迟计算
2016/10/22 Python
python3使用PyMysql连接mysql数据库实例
2017/02/07 Python
python+POP3实现批量下载邮件附件
2018/06/19 Python
python numpy 显示图像阵列的实例
2018/07/02 Python
pandas数据集的端到端处理
2019/02/18 Python
对于Python深浅拷贝的理解
2019/07/29 Python
canvas粒子动画背景的实现示例
2018/09/03 HTML / CSS
波兰运动鞋网上商店:e-Sporting
2018/02/16 全球购物
SQL Server里面什么样的视图才能创建索引
2015/04/17 面试题
社会学专业求职信
2014/02/24 职场文书
满月酒主持词
2014/03/27 职场文书
关于保护环境的建议书
2014/08/26 职场文书
2014年租房协议书范本
2014/10/30 职场文书
工艺技术员岗位职责
2015/02/04 职场文书
行政二审代理词
2015/05/25 职场文书
2019个人年度目标制定攻略!
2019/07/12 职场文书