Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
详解python中requirements.txt的一切
Mar 03 Python
Python竟能画这么漂亮的花,帅呆了(代码分享)
Nov 15 Python
TensorFlow实现非线性支持向量机的实现方法
Apr 28 Python
python实现下载pop3邮件保存到本地
Jun 19 Python
Python 给某个文件名添加时间戳的方法
Oct 16 Python
使用Python实现在Windows下安装Django
Oct 17 Python
Python如何筛选序列中的元素的方法实现
Jul 15 Python
python实时检测键盘输入函数的示例
Jul 17 Python
python傅里叶变换FFT绘制频谱图
Jul 19 Python
python 获取谷歌浏览器保存的密码
Jan 06 Python
numpy实现RNN原理实现
Mar 02 Python
Python基于Opencv识别两张相似图片
Apr 25 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
PHP 数组实例说明
2008/08/18 PHP
php printf输出格式使用说明
2010/12/05 PHP
一个经典的PHP验证码类分享
2014/11/18 PHP
PHP截取指定图片大小的方法
2014/12/10 PHP
js函数调用常用方法详解
2012/12/03 Javascript
jQuery弹性滑动导航菜单实现思路及代码
2013/05/02 Javascript
解决js数据包含加号+通过ajax传到后台时出现连接错误
2013/08/01 Javascript
浅谈String.valueOf()方法的使用
2016/06/06 Javascript
基于Vue如何封装分页组件
2016/12/16 Javascript
微信小程序 解决请求服务器手机预览请求不到数据的方法
2017/01/04 Javascript
canvas实现环形进度条效果
2017/03/23 Javascript
基于JavaScript实现新增内容滚动播放效果附完整代码
2017/08/24 Javascript
vue + vuex todolist的实现示例代码
2018/03/09 Javascript
JavaScript面向对象的程序设计(犯迷糊的小羊)
2018/05/27 Javascript
Vue.js点击切换按钮改变内容的实例讲解
2018/08/22 Javascript
详解vue 2.6 中 slot 的新用法
2019/07/09 Javascript
微信小程序订阅消息(java后端实现)开发
2020/06/01 Javascript
解决VantUI popup 弹窗不弹出或无蒙层的问题
2020/11/03 Javascript
jQuery实现查看图片功能
2020/12/01 jQuery
python实现dict版图遍历示例
2014/02/19 Python
使用Python的turtle模块画图的方法
2017/11/15 Python
对numpy的array和python中自带的list之间相互转化详解
2018/04/13 Python
JSON文件及Python对JSON文件的读写操作
2018/10/07 Python
基于python实现百度翻译功能
2019/05/09 Python
Python配置文件处理的方法教程
2019/08/29 Python
python3实现用turtle模块画一棵随机樱花树
2019/11/21 Python
pytorch 中的重要模块化接口nn.Module的使用
2020/04/02 Python
Pytorch通过保存为ONNX模型转TensorRT5的实现
2020/05/25 Python
Python偏函数实现原理及应用
2020/11/20 Python
python基于socket模拟实现ssh远程执行命令
2020/12/05 Python
Autopep8的使用(python自动编排工具)
2021/03/02 Python
CSS3感应鼠标的背景闪烁和图片缩放动画效果
2014/05/14 HTML / CSS
美国钻石商店:Zales
2016/11/20 全球购物
应届生人事助理求职信
2013/11/09 职场文书
毕业自我鉴定怎么写
2014/03/25 职场文书
2015年环卫工作总结
2015/04/28 职场文书