零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
Python实现命令行通讯录实例教程
Aug 18 Python
python爬虫_微信公众号推送信息爬取的实例
Oct 23 Python
Python中str.join()简单用法示例
Mar 20 Python
DataFrame中的object转换成float的方法
Apr 10 Python
在windows下Python打印彩色字体的方法
May 15 Python
python 利用for循环 保存多个图像或者文件的实例
Nov 09 Python
基于PyQt4和PySide实现输入对话框效果
Feb 27 Python
Python实现查找字符串数组最长公共前缀示例
Mar 27 Python
django框架基于模板 生成 excel(xls) 文件操作示例
Jun 19 Python
python 返回一个列表中第二大的数方法
Jul 09 Python
基于python实现百度语音识别和图灵对话
Nov 02 Python
pytorch实现ResNet结构的实例代码
May 17 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
如何在PHP中使用Oracle数据库(2)
2006/10/09 PHP
PHP中的array数组类型分析说明
2010/07/27 PHP
浅析PHP程序防止ddos,dns,集群服务器攻击的解决办法
2013/06/18 PHP
解析关于java,php以及html的所有文件编码与乱码的处理方法汇总
2013/06/24 PHP
ThinkPHP3.2.3数据库设置新特性
2015/03/05 PHP
thinkphp5.1 文件引入路径问题及注意事项
2018/06/13 PHP
Jquery对select的增、删、改、查操作
2015/02/06 Javascript
FullCalendar日历插件应用之数据展现(一)
2015/12/23 Javascript
微信小程序 wx.request(接口调用方式)详解及实例
2016/11/23 Javascript
webuploader模态框ueditor显示问题解决方法
2016/12/27 Javascript
用angular实现多选按钮的全选与反选实例代码
2017/05/23 Javascript
详解vue express启动数据服务
2017/07/05 Javascript
JS 判断某变量是否为某数组中的一个值的3种方法(总结)
2017/07/10 Javascript
vue mintui-Loadmore结合实现下拉刷新和上拉加载示例
2017/10/12 Javascript
jQuery实现左右两个列表框的内容相互移动功能示例
2019/01/27 jQuery
vue 对axios get pust put delete封装的实例代码
2020/01/05 Javascript
[20:21]《一刀刀一天》第十六期:TI国际邀请赛正式打响,总奖金超过550万
2014/05/23 DOTA
Windows系统下使用flup搭建Nginx和Python环境的方法
2015/12/25 Python
实例解析Python设计模式编程之桥接模式的运用
2016/03/02 Python
Python md5与sha1加密算法用法分析
2017/07/14 Python
Python实现字典按照value进行排序的方法分析
2017/12/23 Python
Python3.6实现根据电影名称(支持电视剧名称),获取下载链接的方法
2019/08/26 Python
布隆过滤器的概述及Python实现方法
2019/12/08 Python
Python+OpenCV图像处理——实现直线检测
2020/10/23 Python
美国Lolё官网:购买大胆而美丽的女性运动服装
2017/05/22 全球购物
水果花束:Fruit Bouquets
2017/12/20 全球购物
Yahoo的PHP面试题
2014/05/26 面试题
普天C++笔试题
2016/03/20 面试题
运动会解说词50字
2014/01/18 职场文书
诉前财产保全担保书
2014/05/20 职场文书
网球场地租赁协议范本
2014/10/07 职场文书
工作检讨书500字
2014/10/19 职场文书
务虚会发言材料
2014/12/25 职场文书
云台山导游词
2015/02/03 职场文书
抢劫罪辩护词
2015/05/21 职场文书
预备党员考察表党小组意见
2015/06/01 职场文书