零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
Python多线程编程(八):使用Event实现线程间通信
Apr 05 Python
由Python运算π的值深入Python中科学计算的实现
Apr 17 Python
django开发之settings.py中变量的全局引用详解
Mar 29 Python
Python队列的定义与使用方法示例
Jun 24 Python
Python实现的大数据分析操作系统日志功能示例
Feb 11 Python
Python中新式类与经典类的区别详析
Jul 10 Python
python实现输入三角形边长自动作图求面积案例
Apr 12 Python
解决python中显示图片的plt.imshow plt.show()内存泄漏问题
Apr 24 Python
利用Python实现某OA系统的自动定位功能
May 27 Python
Python操作MySQL数据库的示例代码
Jul 13 Python
python开发入门——set的使用
Sep 03 Python
Python借助with语句实现代码段只执行有限次
Mar 23 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
解决dede生成静态页和动态页转换的一些问题,及火车采集入库生成动态的办法
2007/03/29 PHP
PHP中3种生成XML文件方法的速度效率比较
2012/10/06 PHP
PHP中设置时区,记录日志文件的实现代码
2013/01/07 PHP
为PHP5.4开启Zend OPCode缓存
2014/12/26 PHP
浅谈PHP各环境下的伪静态配置
2019/03/13 PHP
通过event对象的fromElement属性解决热区设置主实体的一个bug
2008/12/22 Javascript
Javascript学习笔记 delete运算符
2011/09/13 Javascript
很好用的js日历算法详细代码
2013/03/07 Javascript
javascript使用shift+click实现选择和反选checkbox的方法
2015/05/04 Javascript
用jquery快速解决IE输入框不能输入的问题
2016/10/04 Javascript
es7学习教程之fetch解决异步嵌套问题的方法示例
2017/07/21 Javascript
javascript兼容性(实例讲解)
2017/08/15 Javascript
js传递数组参数到后台controller的方法
2018/03/29 Javascript
原生nodejs使用websocket代码分享
2018/04/07 NodeJs
最简单的vue消息提示全局组件的方法
2019/06/16 Javascript
vue动态合并单元格并添加小计合计功能示例
2020/11/26 Vue.js
[01:00:59]VP VS VG Supermajor小组赛胜者组第二轮 BO3第二场 6.2
2018/06/03 DOTA
python生成器的使用方法
2013/11/21 Python
python简单实现基于SSL的IRC bot实例
2015/06/15 Python
浅析Python中的赋值和深浅拷贝
2017/08/15 Python
Linux CentOS7下安装python3 的方法
2018/01/21 Python
Keras 快速解决OOM超内存的问题
2020/06/11 Python
如何在Windows中安装多个python解释器
2020/06/16 Python
使用简单的CSS3属性实现炫酷读者墙效果
2014/01/08 HTML / CSS
HTML5新增form控件和表单属性实例代码详解
2019/05/15 HTML / CSS
简述数据库的设计过程
2015/06/22 面试题
农村党支部先进事迹
2014/01/14 职场文书
太太口服液广告词
2014/03/20 职场文书
2014年销售工作总结
2014/12/01 职场文书
党支部2014年度工作总结
2014/12/04 职场文书
优秀党员申报材料
2014/12/18 职场文书
教师考核鉴定意见
2015/06/05 职场文书
好人好事新闻稿
2015/07/17 职场文书
这样写python注释让代码更加的优雅
2021/06/02 Python
Python使用openpyxl批量处理数据
2021/06/23 Python
ubuntu安装jupyter并设置远程访问的实现
2022/03/31 Python