零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
使用setup.py安装python包和卸载python包的方法
Nov 27 Python
python求列表交集的方法汇总
Nov 10 Python
Python二叉树的定义及常用遍历算法分析
Nov 24 Python
django数据库migrate失败的解决方法解析
Feb 08 Python
使用pandas read_table读取csv文件的方法
Jul 04 Python
Python分割指定页数的pdf文件方法
Oct 26 Python
[原创]Python入门教程5. 字典基本操作【定义、运算、常用函数】
Nov 01 Python
python list转置和前后反转的例子
Aug 26 Python
Spark处理数据排序问题如何避免OOM
May 21 Python
浅谈python量化 双均线策略(金叉死叉)
Jun 03 Python
python爬取youtube视频的示例代码
Mar 03 Python
python获取对象信息的实例详解
Jul 07 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
蝙蝠侠:侠影之谜
2020/03/04 欧美动漫
php AJAX实例根据邮编自动完成地址信息
2008/11/23 PHP
destoon各类调用汇总
2014/06/20 PHP
对于Laravel 5.5核心架构的深入理解
2018/02/22 PHP
PHP使用HTML5 FormData对象提交表单操作示例
2019/07/02 PHP
简略的前端架构心得&&基于editor为例子的编码小技巧
2010/11/25 Javascript
ASP.NET MVC中EasyUI的datagrid跨域调用实现代码
2012/03/14 Javascript
正则表达式搭配js轻松处理json文本方便而老古
2013/02/17 Javascript
JavaScript判断密码强度(自写代码)
2013/09/06 Javascript
Javascript获取表单名称(name)的方法
2015/04/02 Javascript
javascript 使用正则test( )第一次是 true,第二次是false
2017/02/22 Javascript
React Native预设占位placeholder的使用
2017/09/28 Javascript
nodejs使用redis作为缓存介质实现的封装缓存类示例
2018/02/07 NodeJs
jQuery中元素选择器(element)简单用法示例
2018/05/14 jQuery
在vue项目中集成graphql(vue-ApolloClient)
2018/09/08 Javascript
微信小程序开发实现的选项卡(窗口顶部/底部TabBar)页面切换功能图文详解
2019/05/14 Javascript
Angular8引入百度Echarts进行图表分析的实现代码
2019/11/27 Javascript
JavaScript实现简单贪吃蛇效果
2020/03/09 Javascript
ES6字符串的扩展实例
2020/12/21 Javascript
[01:10:48]完美世界DOTA2联赛PWL S2 GXR vs PXG 第一场 11.18
2020/11/18 DOTA
python选择排序算法的实现代码
2013/11/21 Python
python实现微信发送邮件关闭电脑功能
2018/02/22 Python
python面向对象多线程爬虫爬取搜狐页面的实例代码
2018/05/31 Python
python try except 捕获所有异常的实例
2018/10/18 Python
Python closure闭包解释及其注意点详解
2019/08/28 Python
Python如何在main中调用函数内的函数方式
2020/06/01 Python
Swanson中国官网:美国斯旺森健康产品公司
2021/03/01 全球购物
下面关于"联合"的题目的输出是什么
2013/08/06 面试题
一套中级Java程序员笔试题
2015/01/14 面试题
CAD制图设计师自荐信
2014/01/29 职场文书
党员教师一句话承诺
2014/05/30 职场文书
禁毒宣传活动总结
2014/08/26 职场文书
焦裕禄精神心得体会
2014/09/02 职场文书
影视广告专业求职信
2014/09/02 职场文书
2014年心理健康教育工作总结
2014/12/06 职场文书
漫画「日和酱的要求是绝对的」第3卷封面公开
2022/03/21 日漫