零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
在Python中操作列表之List.append()方法的使用
May 20 Python
Python获取文件所在目录和文件名的方法
Jan 12 Python
Python实现的摇骰子猜大小功能小游戏示例
Dec 18 Python
wxPython的安装图文教程(Windows)
Dec 28 Python
详解django+django-celery+celery的整合实战
Mar 19 Python
Python类中方法getitem和getattr详解
Aug 30 Python
学习Python列表的基础知识汇总
Mar 10 Python
pyqt5 QlistView列表显示的实现示例
Mar 24 Python
python3获取控制台输入的数据的具体实例
Aug 16 Python
Python+Selenium实现自动化的环境搭建的步骤(图文)
Sep 01 Python
python 用struct模块解决黏包问题
Nov 07 Python
python爬虫分布式获取数据的实例方法
Nov 26 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
PHP的ASP防火墙
2006/10/09 PHP
发款php蜘蛛统计插件只要有mysql就可用
2010/10/12 PHP
PHP多个版本的分析解释
2011/07/21 PHP
Thinkphp中import的几个用法详细介绍
2014/07/02 PHP
js实现的跟随鼠标移动的时钟效果(中英文日期显示)
2011/01/17 Javascript
流量统计器如何鉴别C#:WebBrowser中伪造referer
2015/01/07 Javascript
JavaScript返回当前会话cookie全部键值对照的方法
2015/04/03 Javascript
jQuery Easyui加载表格出错时在表格中间显示自定义的提示内容
2016/12/08 Javascript
js获取地址栏中传递的参数(两种方法)
2017/02/08 Javascript
深入理解移动前端开发之viewport
2018/10/19 Javascript
axios携带cookie配置详解(axios+koa)
2018/12/28 Javascript
解决微信小程序中转换时间格式IOS不兼容的问题
2019/02/15 Javascript
详解VUE前端按钮权限控制
2019/04/26 Javascript
[02:50]【扭转乾坤,只此一招】DOTA2永雾林渊版本开启新篇章
2020/12/22 DOTA
使用Python装饰器在Django框架下去除冗余代码的教程
2015/04/16 Python
在Python的struct模块中进行数据格式转换的方法
2015/06/17 Python
Python程序中用csv模块来操作csv文件的基本使用教程
2016/03/03 Python
python中如何使用正则表达式的非贪婪模式示例
2017/10/09 Python
python中logging库的使用总结
2017/10/18 Python
Python中一般处理中文的几种方法
2019/03/06 Python
在python下使用tensorflow判断是否存在文件夹的实例
2019/06/10 Python
Python socket模块方法实现详解
2019/11/05 Python
python异常处理、自定义异常、断言原理与用法分析
2020/03/23 Python
Win 10下Anaconda虚拟环境的教程
2020/05/18 Python
python cookie反爬处理的实现
2020/11/01 Python
python中字符串的编码与解码详析
2020/12/03 Python
input file上传文件样式支持html5的浏览器解决方案
2012/11/14 HTML / CSS
信息部岗位职责
2013/11/12 职场文书
幼儿园庆六一活动方案
2014/03/06 职场文书
大学生学习2014年全国两会心得体会
2014/03/12 职场文书
安全伴我行演讲稿
2014/09/04 职场文书
党支部群众路线整改措施思想汇报
2014/10/10 职场文书
公务员政审材料范文
2014/12/23 职场文书
评职称个人总结
2015/03/05 职场文书
mysql sum(if())和count(if())的用法说明
2022/01/18 MySQL
Vue2.0搭建脚手架
2022/03/13 Vue.js