Python2.7下安装Scrapy框架步骤教程


Posted in Python onDecember 22, 2017

由于毕业设计的要求,需要在网站上抓取大量的数据,那么使用Scrapy框架可以让这一过程变得简单不少,毕竟Scrapy是一个为了爬去网站数据、提取结构性数据而编写的应用框架。于是,便开始了我的安装Scrapy框架之旅。可以说这个过程并不是很愉快,各种错误各种出,不过到最后,终于安装上了Scrapy框架。下面总结一下我的Scrapy框架的安装。

1.安装python2.7

由于Scrapy不支持Python3.0,于是我卸载了Python3.0,又重新安装了Python2.7(python2.7安装包),在安装Python2.7的时候,会有一个自动设置环境变量的选项,建议在这里将选项选上,省下后期自己添加环境变量。我们后期自己添加环境变量,就是根据自己实际安装的路径,在系统的环境变量path中添加这两条语句就可以。

Python2.7下安装Scrapy框架步骤教程

在配置完环境之后,我们测试一下我们是否安装配置环境成功。只要在cmd中输入 python ?version ,然后能够显示正确的python版本就可以了。如果未能显示,则重启一下cmd试试。

Python2.7下安装Scrapy框架步骤教程

2.安装pywin32

在安装配置好python2.7之后,我们还不能直接安装Scrapy,我们首先需要安装Scrapy依赖的几个工具。接下来安装pywin32(pywin32安装包),这个软件安装的时候一直next就可以了。

3.安装pip

pip实际上一款比较方便的在线软件安装工具,类似于easy install,我们现在安装pip,在之后的软件安装的时候我们就可以使用 pip install 命令了。首先我们要下载get-pip.py(get-pip.py文件) ,下载完成之后,我们在cmd下进行安装,首先切换到文件所在目录,然后输入python get-pip.py语句,便可以进行安装了,但是最头疼的问题出现了,由于该文件会将一些配置文件自动写入到我们的C盘用户文件目录下,而我的用户目录是中文名,就会产生编码异常。

Python2.7下安装Scrapy框架步骤教程

在查找一番资料之后,终于将问题解决了,为了解决中文路径的问题,我们只需要在 D:\python27\Lib\site-packages的目录下新建一个名为
sitecustomize.py的文件即可。

Python2.7下安装Scrapy框架步骤教程

然后在文件内输入以下代码:

import sys
reload(sys)
sys.setdefaultencoding('gbk')

当然不一定一定要设置为gbk编码,这个根据自己的电脑的编码来设置。这样我们的中文路径问题就算解决了,我们在重启cmd,在执行安装pip语句之后,pip便顺利完成了。安装完成之后,我们可以进行一下检验,在cmd中输入pip ?version,如果显示正确的版本号则说明正确。

Python2.7下安装Scrapy框架步骤教程

4.安装lxml

在安装完成pip之后,本想可以轻松的使用pip install lxml命令来进行安装,但是意外发生了,由于使用pip需要vc2008的环境,而且只能是2008的,2013的都不行。没办法为了使用这款工具,只能在去求教度娘,终于找到了解决办法,原来微软给我们提供了VcForPython(VCForPython安装包),这样我们就不用安装VC2008了,这样之后,我们便可以使用 pip install lxml进行安装了。

5.安装pyOpenSSL

在安装这个工具的时候我们便可以使用 pip install pyOpenSSL 语句来进行安装了,安装的速度取决于网速了。

6.安装Scrapy

终于经历一波坎坷之后,我们终于可以安装Scrapy框架了,在cmd中输入 pip install Scrapy命令之后,我们就可以等着享受成功的喜悦了。在安装完成之后,我们在cmd中输入Scrapy来检测一下,是否真正的安装成功。

Python2.7下安装Scrapy框架步骤教程

终于安装好了,还是有点成就感的。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python遍历目录并批量更换文件名和目录名的方法
Sep 19 Python
详解python之配置日志的几种方式
May 22 Python
Windows下Anaconda的安装和简单使用方法
Jan 04 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 Python
PyQt4实现下拉菜单可供选择并打印出来
Apr 20 Python
python 获取当天凌晨零点的时间戳方法
May 22 Python
在Pycharm中执行scrapy命令的方法
Jan 16 Python
Python 实用技巧之利用Shell通配符做字符串匹配
Aug 23 Python
Django Path转换器自定义及正则代码实例
May 29 Python
让你相见恨晚的十个Python骚操作
Nov 18 Python
详解python中的三种命令行模块(sys.argv,argparse,click)
Dec 15 Python
python删除csv文件的行列
Apr 06 Python
Python机器学习之决策树算法
Dec 22 #Python
python+selenium实现登录账户后自动点击的示例
Dec 22 #Python
python实现决策树
Dec 21 #Python
python利用sklearn包编写决策树源代码
Dec 21 #Python
python实现决策树分类算法
Dec 21 #Python
Python语言描述机器学习之Logistic回归算法
Dec 21 #Python
python Crypto模块的安装与使用方法
Dec 21 #Python
You might like
人族 TERRAN 概述
2020/03/14 星际争霸
献给php初学者(入门学习经验谈)
2010/10/12 PHP
php编程实现获取excel文档内容的代码实例
2011/06/28 PHP
[原创]smarty简单模板变量输出方法
2016/07/09 PHP
PHP一个简单的无需刷新爬虫
2019/01/05 PHP
使用tp框架和SQL语句查询数据表中的某字段包含某值
2019/10/18 PHP
jquery下checked取值问题的解决方法
2012/08/09 Javascript
js设置document.domain实现跨域的注意点分析
2015/05/21 Javascript
javascript实现简单查找与替换的方法
2015/07/22 Javascript
jquery无限级联下拉菜单简单实例演示
2015/11/23 Javascript
日常收藏的jquery技巧
2015/12/02 Javascript
js实现C#的StringBuilder效果完整实例
2015/12/22 Javascript
基于javascript实现图片滑动效果
2016/05/07 Javascript
快速掌握jQuery插件WebUploader文件上传
2016/11/07 Javascript
js自制图片放大镜功能
2017/01/24 Javascript
基于vue2.0+vuex+localStorage开发的本地记事本示例
2017/02/28 Javascript
vue 和vue-touch 实现移动端左右导航效果(仿京东移动站导航)
2017/04/22 Javascript
jQuery实现select下拉框获取当前选中文本、值、索引
2017/05/08 jQuery
JavaScript无操作后屏保功能的实现方法
2017/07/04 Javascript
详解如何实现一个简单的Node.js脚手架
2017/12/04 Javascript
集成vue到jquery/bootstrap项目的方法
2018/02/10 jQuery
微信公众号生成新浪短网址的实现(快速生成)
2019/08/18 Javascript
python3中dict(字典)的使用方法示例
2017/03/22 Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
2018/07/25 Python
Python中numpy模块常见用法demo实例小结
2019/03/16 Python
Python 类,property属性(简化属性的操作),@property,property()用法示例
2019/10/12 Python
pandas dataframe 中的explode函数用法详解
2020/05/18 Python
春秋航空官方网站:Spring Airlines
2017/09/27 全球购物
教师实习自我鉴定
2013/12/18 职场文书
思想汇报格式
2014/01/05 职场文书
亲戚结婚的请假条
2014/02/11 职场文书
工商行政管理专业求职书
2014/05/23 职场文书
大学生第一学年自我鉴定2015
2014/09/28 职场文书
2014年审计工作总结
2014/11/17 职场文书
2015年农村党员公开承诺事项
2015/04/28 职场文书
python+opencv实现视频抽帧示例代码
2021/06/11 Python