Python3安装Scrapy的方法步骤


Posted in Python onNovember 23, 2017

本文介绍了Python3安装Scrapy的方法步骤,分享给大家,具体如下:

  1. 运行平台:Windows
  2. Python版本:Python3.x
  3. IDE:Sublime text3

一、Scrapy简介

Scrapy是一个为了爬取网站数据提取结构性数据而编写的应用框架,可以应用于数据挖掘,信息处理或存储历史数据等一些列的程序中。Scrapy最初就是为了网络爬取而设计的。现在,Scrapy已经推出了曾承诺过的Python3.x版本。

为什么学习Scrapy呢?它能我们更好的完成爬虫任务,自己写Python爬虫程序好比孤军奋战,而使用了Scrapy就好比手底下有了千军万马。Scrapy可以起到事半功倍(甚至好几倍*.*)的效果。所以,学习Scrapy也就显得很有必要了。

二、Scrapy安装

1.直接使用指令pip3 install scrapy,发现有诸多错误。

  1. Failed building wheel for lxml
  2. Microsoft Visual C++ 10.0 is required
  3. Failed building twisted
  4. Unable to find vcvarsall.bat

遇到的错误,如下图所示:

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

2.解决办法

在http://www.lfd.uci.edu/~gohlke/pythonlibs/有很多用于windows的编译好的Python第三方库,我们下载好对应自己Python版本的库即可。

(1)在cmd中输入指令python,查看python的版本,如下:

Python3安装Scrapy的方法步骤

从上图可以看出可以看出我的Python版本为Python3.5.2-64bit。

(2)登陆http://www.lfd.uci.edu/~gohlke/pythonlibs/,Ctrl+F搜索Lxml、Twisted、Scrapy,下载对应的版本,例如:lxml-3.7.3-cp35-cp35m-win_adm64.whl,表示lxml的版本为3.7.3,对应的python版本为3.5-64bit。我下载的版本如下图所示:

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

(3)在cmd中输入DOS指令,进入下载好的whl文件夹下,例如我的三个whl文件放在了Scrapy文件夹下:

Python3安装Scrapy的方法步骤

(4)依次执行如下命令:

a.pip3 install wheel

Python3安装Scrapy的方法步骤

b.pip3 install lxml-3.7.3-cp35-cp35m-win_amd64.whl

Python3安装Scrapy的方法步骤

c.pip3 install Twisted-17.1.0-cp35-cp35m-win_amd64.whl

Python3安装Scrapy的方法步骤

d.pip3 install Scrapy-1.3.2-py2.py3-none-any.whl

Python3安装Scrapy的方法步骤

这样Scrapy的安装就完成了,请忽略最后两行让我升级pip的信息。*.*

(5)Srapy已经安装成功,还要下载pywin32,找到对应版本下载,一路下一步安装即可。安装完成后,就可以正常使用Scrapy了。

URL:https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/

Python3安装Scrapy的方法步骤

至此,大功告成,我们可以愉快的使用Scrapy了。

常见错误

1、pkg_resources.VersionConflict: (six 1.5.2 (/usr/lib/python3/dist-packages), Requirement.parse('six>=1.6.0'))

six包版本过低,six包是一个提供兼容Python2和Python3的库,升级six包即可。

sudo pip3 install -U six

2、c/_cffi_backend.c:15:17: fatal error: ffi.h: No such file or directory

缺少Libffi这个库。什么是libffi?“FFI” 的全名是 Foreign Function Interface,通常指的是允许以一种语言编写的代码调用另一种语言的代码。而Libffi库只提供了最底层的、与架构相关的、完整的”FFI”。

安装相应的库即可。

Ubuntu、Debian:

sudo apt-get install build-essential libssl-dev libffi-dev python3-dev

CentOS、RedHat:

sudo yum install gcc libffi-devel python-devel openssl-devel

3、ImportError: No module named 'cryptography'

这是缺少加密的相关组件,利用pip安装即可。

sudo pip3 install cryptography

4、ImportError: No module named 'packaging'

缺少packaging这个包,它提供了Python包的核心功能,利用pip安装即可。

sudo pip3 install packaging

5、ImportError: No module named 'appdirs'

缺少appdirs这个包,它用来确定文件目录,利用pip单独安装即可。

sudo pip3 install appdirs

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python标准库之随机数 (math包、random包)介绍
Nov 25 Python
python实现的简单RPG游戏流程实例
Jun 28 Python
Python打印斐波拉契数列实例
Jul 07 Python
Python松散正则表达式用法分析
Apr 29 Python
微信跳一跳python自动代码解读1.0
Jan 12 Python
使用Python实现在Windows下安装Django
Oct 17 Python
python pyheatmap包绘制热力图
Nov 09 Python
python用类实现文章敏感词的过滤方法示例
Oct 27 Python
Python Selenium安装及环境配置的实现
Mar 17 Python
windows上彻底删除jupyter notebook的实现
Apr 13 Python
在主流系统之上安装Pygame的方法
May 20 Python
matplotlib绘制鼠标的十字光标的实现(自定义方式,官方实例)
Jan 10 Python
Python 和 JS 有哪些相同之处
Nov 23 #Python
深入理解Python分布式爬虫原理
Nov 23 #Python
Python实现希尔排序算法的原理与用法实例分析
Nov 23 #Python
Python 用Redis简单实现分布式爬虫的方法
Nov 23 #Python
Python3 伪装浏览器的方法示例
Nov 23 #Python
python学习笔记之列表(list)与元组(tuple)详解
Nov 23 #Python
python数字图像处理之高级滤波代码详解
Nov 23 #Python
You might like
echo, print, printf 和 sprintf 区别
2006/12/06 PHP
PHP中for循环语句的几种变型
2007/03/16 PHP
让PHP支持页面回退的两种方法
2008/01/10 PHP
PHP轻量级数据库操作类Medoo增加、删除、修改、查询例子
2014/07/04 PHP
PHP封装的Twitter访问类实例
2015/07/18 PHP
告诉大家什么是JSON
2008/06/10 Javascript
犀利的js 函数集合
2009/06/11 Javascript
Ubuntu 11.10 安装Node.js的方法
2011/11/30 Javascript
Javascript类定义语法,私有成员、受保护成员、静态成员等介绍
2011/12/08 Javascript
jquery的父子兄弟节点查找示例代码
2014/03/03 Javascript
js实现checkbox全选和反选示例
2014/05/01 Javascript
javascript动态控制服务器控件实例
2014/09/05 Javascript
浅谈jQuery事件绑定原理
2015/01/02 Javascript
JS设置手机验证码60s等待实现代码
2017/06/14 Javascript
微信小程序开发之map地图组件定位并手动修改位置偏差
2019/08/17 Javascript
微信小程序引入VANT组件的方法步骤
2019/09/19 Javascript
JS前端广告拦截实现原理解析
2020/02/17 Javascript
js回调函数原理与用法案例分析
2020/03/04 Javascript
小程序瀑布流组件实现翻页与图片懒加载
2020/05/19 Javascript
[01:46]辉夜杯—打造中国DOTA新格局
2015/12/25 DOTA
[01:28]国服启动器接入蒸汽平台操作流程视频
2021/03/11 DOTA
python网络爬虫采集联想词示例
2014/02/11 Python
python socket多线程通讯实例分析(聊天室)
2016/04/06 Python
Python实现代码统计工具(终极篇)
2016/07/04 Python
Python如何判断数独是否合法
2016/09/08 Python
Python读取excel中的图片完美解决方法
2018/07/27 Python
Python3.6简单的操作Mysql数据库的三个实例
2018/10/17 Python
python3编写ThinkPHP命令执行Getshell的方法
2019/02/26 Python
Python里面search()和match()的区别
2016/09/21 面试题
护理专科毕业推荐信
2013/11/10 职场文书
员工考核管理制度
2014/02/02 职场文书
师德师风自查总结
2014/10/14 职场文书
药店营业员岗位职责
2015/04/14 职场文书
导游词之河北野三坡
2019/12/11 职场文书
mysql5.7使用binlog 恢复数据的方法
2021/06/03 MySQL
Java生成读取条形码和二维码的简单示例
2021/07/09 Java/Android