零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
python 布尔操作实现代码
Mar 23 Python
Python过滤函数filter()使用自定义函数过滤序列实例
Aug 26 Python
在Python的struct模块中进行数据格式转换的方法
Jun 17 Python
Python3之读取连接过的网络并定位的方法
Apr 22 Python
python实现五子棋小游戏
Mar 25 Python
Django异步任务之Celery的基本使用
Mar 23 Python
python调用webservice接口的实现
Jul 12 Python
django+tornado实现实时查看远程日志的方法
Aug 12 Python
Python+OpenCV检测灯光亮点的实现方法
Nov 02 Python
Pycharm创建python文件自动添加日期作者等信息(步骤详解)
Feb 03 Python
手残删除python之后的补救方法
Jun 26 Python
使用python将HTML转换为PDF pdfkit包(wkhtmltopdf) 的使用方法
Apr 21 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
CentOS 6.3下安装PHP xcache扩展模块笔记
2014/09/10 PHP
老司机传授Ubuntu下Apache+PHP+MySQL环境搭建攻略
2016/03/20 PHP
在 Laravel 项目中使用 webpack-encore的方法
2019/07/21 PHP
PHP数组与字符串互相转换实例
2020/05/05 PHP
Yii 框架使用Forms操作详解
2020/05/18 PHP
JS小功能(offsetLeft实现图片滚动效果)实例代码
2013/11/28 Javascript
鼠标悬浮停留三秒后自动显示大图js代码
2014/09/09 Javascript
javascript实现倒计时(精确到秒)
2015/06/26 Javascript
javascript实现选中复选框后相关输入框变灰不可用的方法
2015/08/11 Javascript
自己动手写的javascript前端等待控件
2015/10/30 Javascript
node操作mysql数据库实例详解
2017/03/17 Javascript
JS排序之选择排序详解
2017/04/08 Javascript
vue2.0中goods选购栏滚动算法的实现代码
2017/05/17 Javascript
weex里Vuex state使用storage持久化详解
2017/09/09 Javascript
JS+H5 Canvas实现时钟效果
2018/07/20 Javascript
理顺8个版本vue的区别(小结)
2018/09/17 Javascript
vue实现类似淘宝商品评价页面星级评价及上传多张图片功能
2018/10/29 Javascript
JavaScript动态添加数据到表单并提交的几种方式
2019/06/26 Javascript
Vue动态面包屑功能的实现方法
2019/07/01 Javascript
改进 JavaScript 和 Rust 的互操作性并深入认识 wasm-bindgen 组件
2019/07/13 Javascript
15分钟上手vue3.0(小结)
2020/05/20 Javascript
nodejs+express最简易的连接数据库的方法
2020/12/23 NodeJs
python爬虫实战之爬取京东商城实例教程
2017/04/24 Python
ubuntu系统下使用pm2设置nodejs开机自启动的方法
2018/05/12 NodeJs
Python参数传递实现过程及原理详解
2020/05/14 Python
python语言是免费还是收费的?
2020/06/15 Python
Python读取yaml文件的详细教程
2020/07/21 Python
Python实现迪杰斯特拉算法并生成最短路径的示例代码
2020/12/01 Python
校企合作协议书
2014/04/16 职场文书
勾股定理课后反思
2014/04/26 职场文书
2014年党员自我剖析材料
2014/10/07 职场文书
出差报告范文
2014/11/06 职场文书
给病人的慰问信
2015/03/23 职场文书
2015年小学美术工作总结
2015/05/25 职场文书
毕业论文答辩稿范文
2015/06/23 职场文书
使用RedisTemplat实现简单的分布式锁
2021/11/20 Redis