零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
python urllib urlopen()对象方法/代理的补充说明
Jun 29 Python
人工智能最火编程语言 Python大战Java!
Nov 13 Python
Python matplotlib绘图可视化知识点整理(小结)
Mar 16 Python
Python pymongo模块常用操作分析
Sep 01 Python
python集合比较(交集,并集,差集)方法详解
Sep 13 Python
python 限制函数执行时间,自己实现timeout的实例
Jan 12 Python
python实现QQ批量登录功能
Jun 19 Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 Python
打包PyQt5应用时的注意事项
Feb 14 Python
pycharm实现在虚拟环境中引入别人的项目
Mar 09 Python
Python matplotlib图例放在外侧保存时显示不完整问题解决
Jul 28 Python
Pyhton模块和包相关知识总结
May 12 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
php实现的RSS生成类实例
2015/04/23 PHP
php抽象类和接口知识点整理总结
2019/08/02 PHP
解决Laravel5.x的php artisan migrate数据库迁移创建操作报错SQLSTATE[42000]
2020/04/06 PHP
jQuery(非HTML5)可编辑表格实现代码
2012/12/11 Javascript
Javascript合并表格中具有相同内容单元格示例
2013/08/11 Javascript
jquery快捷动态绑定键盘事件的操作函数代码
2013/10/17 Javascript
利用javascript实现web页面中指定区域打印
2013/10/30 Javascript
使用jQuery异步加载 JavaScript脚本解决方案
2014/04/20 Javascript
javascript设计模式之中介者模式Mediator
2014/12/30 Javascript
JavaScript实现简单的数字倒计时
2015/05/15 Javascript
AngularJS基础 ng-open 指令简单实例
2016/08/02 Javascript
Bootstrap框架结合jQuery仿百度换肤功能实例解析
2016/09/17 Javascript
bootstrap中使用google prettify让代码高亮的方法
2016/10/21 Javascript
elemetUi 组件--el-upload实现上传Excel文件的实例
2017/10/27 Javascript
原生JS实现的自动轮播图功能详解
2018/12/28 Javascript
微信小游戏之使用three.js 绘制一个旋转的三角形
2019/06/10 Javascript
jQuery插件simplePagination的使用方法示例
2020/04/28 jQuery
vue实现自定义多选按钮
2020/07/16 Javascript
浅谈vue单页面中有多个echarts图表时的公用代码写法
2020/07/19 Javascript
Python算法之栈(stack)的实现
2014/08/18 Python
python实现的简单抽奖系统实例
2015/05/22 Python
selenium获取当前页面的url、源码、title的方法
2019/06/12 Python
python-numpy-指数分布实例详解
2019/12/07 Python
使用Python合成图片的实现代码(图片添加个性化文本,图片上叠加其他图片)
2020/04/30 Python
keras自动编码器实现系列之卷积自动编码器操作
2020/07/03 Python
Alba Moda德国网上商店:意大利时尚女装销售
2016/11/14 全球购物
Talbots官网:美国成熟女装品牌
2019/11/15 全球购物
澳大利亚家居用品零售商:Harris Scarfe
2020/10/10 全球购物
巴西购物网站:Onofre Agora
2020/06/08 全球购物
介绍一下mysql的日期和时间函数
2013/03/28 面试题
大学生职业规划范文:象牙塔生活的四年计划
2014/01/14 职场文书
首都博物馆观后感
2015/06/05 职场文书
《走遍天下书为侣》教学反思
2016/02/22 职场文书
使用nginx动态转换图片大小生成缩略图
2021/03/31 Servers
Spring Cloud Gateway去掉url前缀
2021/07/15 Java/Android
yyds什么意思?90后已经听不懂00后讲话了……
2022/02/03 杂记