Python3安装Scrapy的方法步骤


Posted in Python onNovember 23, 2017

本文介绍了Python3安装Scrapy的方法步骤,分享给大家,具体如下:

  1. 运行平台:Windows
  2. Python版本:Python3.x
  3. IDE:Sublime text3

一、Scrapy简介

Scrapy是一个为了爬取网站数据提取结构性数据而编写的应用框架,可以应用于数据挖掘,信息处理或存储历史数据等一些列的程序中。Scrapy最初就是为了网络爬取而设计的。现在,Scrapy已经推出了曾承诺过的Python3.x版本。

为什么学习Scrapy呢?它能我们更好的完成爬虫任务,自己写Python爬虫程序好比孤军奋战,而使用了Scrapy就好比手底下有了千军万马。Scrapy可以起到事半功倍(甚至好几倍*.*)的效果。所以,学习Scrapy也就显得很有必要了。

二、Scrapy安装

1.直接使用指令pip3 install scrapy,发现有诸多错误。

  1. Failed building wheel for lxml
  2. Microsoft Visual C++ 10.0 is required
  3. Failed building twisted
  4. Unable to find vcvarsall.bat

遇到的错误,如下图所示:

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

2.解决办法

在http://www.lfd.uci.edu/~gohlke/pythonlibs/有很多用于windows的编译好的Python第三方库,我们下载好对应自己Python版本的库即可。

(1)在cmd中输入指令python,查看python的版本,如下:

Python3安装Scrapy的方法步骤

从上图可以看出可以看出我的Python版本为Python3.5.2-64bit。

(2)登陆http://www.lfd.uci.edu/~gohlke/pythonlibs/,Ctrl+F搜索Lxml、Twisted、Scrapy,下载对应的版本,例如:lxml-3.7.3-cp35-cp35m-win_adm64.whl,表示lxml的版本为3.7.3,对应的python版本为3.5-64bit。我下载的版本如下图所示:

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

Python3安装Scrapy的方法步骤

(3)在cmd中输入DOS指令,进入下载好的whl文件夹下,例如我的三个whl文件放在了Scrapy文件夹下:

Python3安装Scrapy的方法步骤

(4)依次执行如下命令:

a.pip3 install wheel

Python3安装Scrapy的方法步骤

b.pip3 install lxml-3.7.3-cp35-cp35m-win_amd64.whl

Python3安装Scrapy的方法步骤

c.pip3 install Twisted-17.1.0-cp35-cp35m-win_amd64.whl

Python3安装Scrapy的方法步骤

d.pip3 install Scrapy-1.3.2-py2.py3-none-any.whl

Python3安装Scrapy的方法步骤

这样Scrapy的安装就完成了,请忽略最后两行让我升级pip的信息。*.*

(5)Srapy已经安装成功,还要下载pywin32,找到对应版本下载,一路下一步安装即可。安装完成后,就可以正常使用Scrapy了。

URL:https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/

Python3安装Scrapy的方法步骤

至此,大功告成,我们可以愉快的使用Scrapy了。

常见错误

1、pkg_resources.VersionConflict: (six 1.5.2 (/usr/lib/python3/dist-packages), Requirement.parse('six>=1.6.0'))

six包版本过低,six包是一个提供兼容Python2和Python3的库,升级six包即可。

sudo pip3 install -U six

2、c/_cffi_backend.c:15:17: fatal error: ffi.h: No such file or directory

缺少Libffi这个库。什么是libffi?“FFI” 的全名是 Foreign Function Interface,通常指的是允许以一种语言编写的代码调用另一种语言的代码。而Libffi库只提供了最底层的、与架构相关的、完整的”FFI”。

安装相应的库即可。

Ubuntu、Debian:

sudo apt-get install build-essential libssl-dev libffi-dev python3-dev

CentOS、RedHat:

sudo yum install gcc libffi-devel python-devel openssl-devel

3、ImportError: No module named 'cryptography'

这是缺少加密的相关组件,利用pip安装即可。

sudo pip3 install cryptography

4、ImportError: No module named 'packaging'

缺少packaging这个包,它提供了Python包的核心功能,利用pip安装即可。

sudo pip3 install packaging

5、ImportError: No module named 'appdirs'

缺少appdirs这个包,它用来确定文件目录,利用pip单独安装即可。

sudo pip3 install appdirs

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之大话题小函数(1)
Oct 10 Python
零基础写python爬虫之爬虫的定义及URL构成
Nov 04 Python
Python中函数参数设置及使用的学习笔记
May 03 Python
Python中scatter函数参数及用法详解
Nov 08 Python
python实现给scatter设置颜色渐变条colorbar的方法
Dec 13 Python
python生成器与迭代器详解
Jan 01 Python
python Pandas库基础分析之时间序列的处理详解
Jul 13 Python
Python 解码Base64 得到码流格式文本实例
Jan 09 Python
python opencv 实现读取、显示、写入图像的方法
Jun 08 Python
Django利用AJAX技术实现博文实时搜索
May 06 Python
pytorch 一行代码查看网络参数总量的实现
May 12 Python
python tqdm用法及实例详解
Jun 16 Python
Python 和 JS 有哪些相同之处
Nov 23 #Python
深入理解Python分布式爬虫原理
Nov 23 #Python
Python实现希尔排序算法的原理与用法实例分析
Nov 23 #Python
Python 用Redis简单实现分布式爬虫的方法
Nov 23 #Python
Python3 伪装浏览器的方法示例
Nov 23 #Python
python学习笔记之列表(list)与元组(tuple)详解
Nov 23 #Python
python数字图像处理之高级滤波代码详解
Nov 23 #Python
You might like
Zend Framework框架之Zend_Mail实现发送Email邮件验证功能及解决标题乱码的方法
2016/03/21 PHP
php简单统计在线人数的方法
2016/05/10 PHP
PHP基于DOM创建xml文档的方法示例
2017/02/08 PHP
Laravel接收前端ajax传来的数据的实例代码
2017/07/20 PHP
基于swoole实现多人聊天室
2018/06/14 PHP
Yii1.1框架实现PHP极光推送消息通知功能
2018/09/06 PHP
解析ScrollPic在ie8下只滚动一遍,然后变为空白 ie6,ie7,chrome,firefox正常
2013/06/26 Javascript
Node.js的特点详解
2017/02/03 Javascript
利用node.js搭建简单web服务器的方法教程
2017/02/20 Javascript
解决微信二次分享不显示摘要和图片的问题
2017/08/18 Javascript
vue中动态绑定表单元素的属性方法
2018/02/23 Javascript
Vue监听数据渲染DOM完以后执行某个函数详解
2018/09/11 Javascript
JS如何获取地址栏的参数实例讲解
2018/10/06 Javascript
javascript面向对象三大特征之封装实例详解
2019/07/24 Javascript
vue项目引入ts步骤(小结)
2019/10/31 Javascript
解决vue中axios设置超时(超过5分钟)没反应的问题
2020/09/04 Javascript
使用PyV8在Python爬虫中执行js代码
2017/02/16 Python
Windows安装Python、pip、easy_install的方法
2017/03/05 Python
在cmd命令行里进入和退出Python程序的方法
2018/05/12 Python
tensorflow实现逻辑回归模型
2018/09/08 Python
基于python指定包的安装路径方法
2018/10/27 Python
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
2019/06/03 Python
pandas数据拼接的实现示例
2020/04/16 Python
详解pandas apply 并行处理的几种方法
2021/02/24 Python
哥伦比亚最大的网上商店:Linio哥伦比亚
2016/09/25 全球购物
Spartoo瑞典:鞋子、包包和衣服
2018/09/15 全球购物
简短大学毕业感言
2014/01/18 职场文书
内蒙古鄂尔多斯市市长寄语
2014/04/10 职场文书
2014年党员自我评议(5篇)
2014/09/12 职场文书
2015年元旦促销方案书
2014/12/09 职场文书
2014年基建工作总结
2014/12/12 职场文书
论文致谢词范文
2015/05/14 职场文书
2015年小学总务工作总结
2015/07/21 职场文书
2019年让高校“心动”的自荐信
2019/03/25 职场文书
PHP 时间处理类Carbon
2022/05/20 PHP
TaiShan 200服务器安装Ubuntu 18.04的图文教程
2022/06/28 Servers