编程 Python

Windows下安装Scrapy

Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序，想到爬虫程序立马就想到了python，python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了，正好发现了python有一个开源库scrapy，正是用来实现爬虫框架的，于是果断采用这个实现。下面就先安装scrapy，决定在windows下面安装。

Scrapy简介

Scrapy，Python开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架，任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类，如BaseSpider、sitemap爬虫等，最新版本又提供了web2.0爬虫的支持。

安装依赖

Scrapy安装依赖于以下几个Python库
lxml, an efficient XML and HTML parser
parsel, an HTML/XML data extraction library written on top of lxml,
w3lib, a multi-purpose helper for dealing with URLs and web page encodings
twisted, an asynchronous networking framework
cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

pip install lxml
pip install parsel
pip install w3lib
pip install twisted
pip install cryptography
pip install pyOpenSSL

其他的安装都很顺利，就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装（下载自己的版本）
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录，然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy，出现如下界面，则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Windows下安装Scrapy

- Author -

no-96

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

详解python中requirements.txt的一切

Mar 03 Python

Python竟能画这么漂亮的花,帅呆了(代码分享)

Nov 15 Python

TensorFlow实现非线性支持向量机的实现方法

Apr 28 Python

python实现下载pop3邮件保存到本地

Jun 19 Python

Python 给某个文件名添加时间戳的方法

Oct 16 Python

使用Python实现在Windows下安装Django

Oct 17 Python

Python如何筛选序列中的元素的方法实现

Jul 15 Python

python实时检测键盘输入函数的示例

Jul 17 Python

python傅里叶变换FFT绘制频谱图

Jul 19 Python

python 获取谷歌浏览器保存的密码

Jan 06 Python

numpy实现RNN原理实现

Mar 02 Python

Python基于Opencv识别两张相似图片

Apr 25 Python

python高级特性和高阶函数及使用详解

Oct 17 #Python

基于python实现学生管理系统

Oct 17 #Python

python3.4控制用户输入与输出的方法

Oct 17 #Python

python学生信息管理系统（完整版）

Apr 05 #Python

python3的输入方式及多组输入方法

Oct 17 #Python

Python3.6使用tesseract-ocr的正确方法

Oct 17 #Python

python学生信息管理系统（初级版）

Oct 17 #Python

You might like

PHP 数组实例说明

2008/08/18 PHP

php printf输出格式使用说明

2010/12/05 PHP

一个经典的PHP验证码类分享

2014/11/18 PHP

PHP截取指定图片大小的方法

2014/12/10 PHP

js函数调用常用方法详解

2012/12/03 Javascript

jQuery弹性滑动导航菜单实现思路及代码

2013/05/02 Javascript

解决js数据包含加号+通过ajax传到后台时出现连接错误

2013/08/01 Javascript

浅谈String.valueOf()方法的使用

2016/06/06 Javascript

基于Vue如何封装分页组件

2016/12/16 Javascript

微信小程序解决请求服务器手机预览请求不到数据的方法

2017/01/04 Javascript

canvas实现环形进度条效果

2017/03/23 Javascript

基于JavaScript实现新增内容滚动播放效果附完整代码

2017/08/24 Javascript

vue + vuex todolist的实现示例代码

2018/03/09 Javascript

JavaScript面向对象的程序设计(犯迷糊的小羊)

2018/05/27 Javascript

Vue.js点击切换按钮改变内容的实例讲解

2018/08/22 Javascript

详解vue 2.6 中 slot 的新用法

2019/07/09 Javascript

微信小程序订阅消息(java后端实现)开发

2020/06/01 Javascript

解决VantUI popup 弹窗不弹出或无蒙层的问题

2020/11/03 Javascript

jQuery实现查看图片功能

2020/12/01 jQuery

python实现dict版图遍历示例

2014/02/19 Python

使用Python的turtle模块画图的方法

2017/11/15 Python

对numpy的array和python中自带的list之间相互转化详解

2018/04/13 Python

JSON文件及Python对JSON文件的读写操作

2018/10/07 Python

基于python实现百度翻译功能

2019/05/09 Python

Python配置文件处理的方法教程

2019/08/29 Python

python3实现用turtle模块画一棵随机樱花树

2019/11/21 Python

pytorch 中的重要模块化接口nn.Module的使用

2020/04/02 Python

Pytorch通过保存为ONNX模型转TensorRT5的实现

2020/05/25 Python

Python偏函数实现原理及应用

2020/11/20 Python

python基于socket模拟实现ssh远程执行命令

2020/12/05 Python

Autopep8的使用(python自动编排工具)

2021/03/02 Python

CSS3感应鼠标的背景闪烁和图片缩放动画效果

2014/05/14 HTML / CSS

美国钻石商店：Zales

2016/11/20 全球购物

应届生人事助理求职信

2013/11/09 职场文书

毕业自我鉴定怎么写

2014/03/25 职场文书

2015年环卫工作总结

2015/04/28 职场文书