Python3安装Scrapy的方法步骤


Posted in Python onNovember 23, 2017

本文介绍了Python3安装Scrapy的方法步骤,分享给大家,具体如下:

  1. 运行平台:Windows
  2. Python版本:Python3.x
  3. IDE:Sublime text3

一、Scrapy简介

Scrapy是一个为了爬取网站数据提取结构性数据而编写的应用框架,可以应用于数据挖掘,信息处理或存储历史数据等一些列的程序中。Scrapy最初就是为了网络爬取而设计的。现在,Scrapy已经推出了曾承诺过的Python3.x版本。

为什么学习Scrapy呢?它能我们更好的完成爬虫任务,自己写Python爬虫程序好比孤军奋战,而使用了Scrapy就好比手底下有了千军万马。Scrapy可以起到事半功倍(甚至好几倍*.*)的效果。所以,学习Scrapy也就显得很有必要了。

二、Scrapy安装

1.直接使用指令pip3 install scrapy,发现有诸多错误。

  1. Failed building wheel for lxml
  2. Microsoft Visual C++ 10.0 is required
  3. Failed building twisted
  4. Unable to find vcvarsall.bat

遇到的错误,如下图所示:

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

2.解决办法

在http://www.lfd.uci.edu/~gohlke/pythonlibs/有很多用于windows的编译好的Python第三方库,我们下载好对应自己Python版本的库即可。

(1)在cmd中输入指令python,查看python的版本,如下:

Python3安装Scrapy的方法步骤

从上图可以看出可以看出我的Python版本为Python3.5.2-64bit。

(2)登陆http://www.lfd.uci.edu/~gohlke/pythonlibs/,Ctrl+F搜索Lxml、Twisted、Scrapy,下载对应的版本,例如:lxml-3.7.3-cp35-cp35m-win_adm64.whl,表示lxml的版本为3.7.3,对应的python版本为3.5-64bit。我下载的版本如下图所示:

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

(3)在cmd中输入DOS指令,进入下载好的whl文件夹下,例如我的三个whl文件放在了Scrapy文件夹下:

Python3安装Scrapy的方法步骤

(4)依次执行如下命令:

a.pip3 install wheel

Python3安装Scrapy的方法步骤

b.pip3 install lxml-3.7.3-cp35-cp35m-win_amd64.whl

Python3安装Scrapy的方法步骤

c.pip3 install Twisted-17.1.0-cp35-cp35m-win_amd64.whl

Python3安装Scrapy的方法步骤

d.pip3 install Scrapy-1.3.2-py2.py3-none-any.whl

Python3安装Scrapy的方法步骤

这样Scrapy的安装就完成了,请忽略最后两行让我升级pip的信息。*.*

(5)Srapy已经安装成功,还要下载pywin32,找到对应版本下载,一路下一步安装即可。安装完成后,就可以正常使用Scrapy了。

URL:https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/

Python3安装Scrapy的方法步骤

至此,大功告成,我们可以愉快的使用Scrapy了。

常见错误

1、pkg_resources.VersionConflict: (six 1.5.2 (/usr/lib/python3/dist-packages), Requirement.parse('six>=1.6.0'))

six包版本过低,six包是一个提供兼容Python2和Python3的库,升级six包即可。

sudo pip3 install -U six

2、c/_cffi_backend.c:15:17: fatal error: ffi.h: No such file or directory

缺少Libffi这个库。什么是libffi?“FFI” 的全名是 Foreign Function Interface,通常指的是允许以一种语言编写的代码调用另一种语言的代码。而Libffi库只提供了最底层的、与架构相关的、完整的”FFI”。

安装相应的库即可。

Ubuntu、Debian:

sudo apt-get install build-essential libssl-dev libffi-dev python3-dev

CentOS、RedHat:

sudo yum install gcc libffi-devel python-devel openssl-devel

3、ImportError: No module named 'cryptography'

这是缺少加密的相关组件,利用pip安装即可。

sudo pip3 install cryptography

4、ImportError: No module named 'packaging'

缺少packaging这个包,它提供了Python包的核心功能,利用pip安装即可。

sudo pip3 install packaging

5、ImportError: No module named 'appdirs'

缺少appdirs这个包,它用来确定文件目录,利用pip单独安装即可。

sudo pip3 install appdirs

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python使用scrapy采集时伪装成HTTP/1.1的方法
Apr 08 Python
Python selenium 三种等待方式解读
Sep 15 Python
linux环境下python中MySQLdb模块的安装方法
Jun 16 Python
Python过滤txt文件内重复内容的方法
Oct 21 Python
解决新版Pycharm中Matplotlib图像不在弹出独立的显示窗口问题
Jan 15 Python
Python单元和文档测试实例详解
Apr 11 Python
django 信号调度机制详解
Jul 19 Python
wxPython多个窗口的基本结构
Nov 19 Python
python使用正则表达式(Regular Expression)方法超详细
Dec 30 Python
深入浅析Python 函数注解与匿名函数
Feb 24 Python
基于plt.title无法显示中文的快速解决
May 16 Python
解决keras backend 越跑越慢问题
Jun 18 Python
Python 和 JS 有哪些相同之处
Nov 23 #Python
深入理解Python分布式爬虫原理
Nov 23 #Python
Python实现希尔排序算法的原理与用法实例分析
Nov 23 #Python
Python 用Redis简单实现分布式爬虫的方法
Nov 23 #Python
Python3 伪装浏览器的方法示例
Nov 23 #Python
python学习笔记之列表(list)与元组(tuple)详解
Nov 23 #Python
python数字图像处理之高级滤波代码详解
Nov 23 #Python
You might like
php广告加载类用法实例
2014/09/23 PHP
服务器迁移php版本不同可能诱发的问题
2015/12/22 PHP
PHP中call_user_func_array回调函数的用法示例
2016/11/26 PHP
JS简单实现元素复制示例附图
2013/11/19 Javascript
node.js中的console.log方法使用说明
2014/12/09 Javascript
javascript实现禁止复制网页内容
2014/12/16 Javascript
jQuery链使用指南
2015/01/20 Javascript
JavaScript函数详解
2015/02/27 Javascript
基于JavaScript操作DOM常用的API小结
2015/12/01 Javascript
window.close(); 关闭浏览器窗口js代码的总结介绍
2016/07/14 Javascript
nodejs 终端打印进度条实例代码
2017/04/22 NodeJs
Vue项目分环境打包的实现步骤
2018/04/02 Javascript
Vue.js 中的 v-model 指令及绑定表单元素的方法
2018/12/03 Javascript
在Layui 的表格模板中,实现layer父页面和子页面传值交互的方法
2019/09/10 Javascript
webpack.DefinePlugin与cross-env区别详解
2020/02/23 Javascript
实现一个Vue自定义指令懒加载的方法示例
2020/06/04 Javascript
使用Python编写Linux系统守护进程实例
2015/02/03 Python
python简单的函数定义和用法实例
2015/05/07 Python
Python中splitlines()方法的使用简介
2015/05/20 Python
Django使用Jinja2模板引擎的示例代码
2019/08/09 Python
Numpy中对向量、矩阵的使用详解
2019/10/29 Python
python+requests接口压力测试500次,查看响应时间的实例
2020/04/30 Python
美国基督教约会网站:ChristianCafe.com
2020/02/04 全球购物
计算机专业大学生的自我评价
2013/11/14 职场文书
服装设计专业自荐书范文
2013/12/30 职场文书
应聘面试自我评价
2014/01/24 职场文书
赡养老人协议书
2014/04/21 职场文书
董事长助理工作职责
2014/06/08 职场文书
湖南省召开党的群众路线教育实践活动总结大会报告
2014/10/21 职场文书
小学班主任评语
2014/12/29 职场文书
大学感恩节活动总结
2015/05/05 职场文书
自书遗嘱范文
2015/08/07 职场文书
《比的意义》教学反思
2016/02/18 职场文书
幼儿园教师教学反思
2016/03/02 职场文书
Vue+Element UI实现概要小弹窗的全过程
2021/05/30 Vue.js
Python开发五子棋小游戏
2022/05/02 Python