Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
pytyon 带有重复的全排列
Aug 13 Python
Python3简单实例计算同花的概率代码
Dec 06 Python
python 寻找list中最大元素对应的索引方法
Jun 28 Python
Python中pip更新和三方插件安装说明
Jul 08 Python
django进阶之cookie和session的使用示例
Aug 17 Python
Python图像处理之颜色的定义与使用分析
Jan 03 Python
Django基础知识 URL路由系统详解
Jul 18 Python
django中上传图片分页三级联动效果的实现代码
Aug 30 Python
在python中做正态性检验示例
Dec 09 Python
基于Python中random.sample()的替代方案
May 23 Python
Python如何实现定时器功能
May 28 Python
使用opencv识别图像红色区域,并输出红色区域中心点坐标
Jun 02 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
关于BIG5-HKSCS的解决方法
2007/03/20 PHP
PHP 判断变量类型实现代码
2009/10/23 PHP
fleaphp rolesNameField bug解决方法
2011/04/23 PHP
判断Keep-Alive模式的HTTP请求的结束的实现代码
2011/08/06 PHP
ThinkPHP框架安全实现分析
2016/03/14 PHP
如何在Laravel之外使用illuminate组件详解
2020/09/20 PHP
prototype 源码中文说明之 prototype.js
2006/09/22 Javascript
Google韩国首页图标动画效果
2007/08/26 Javascript
jQuery的一些特性和用法整理小结
2010/01/13 Javascript
在JavaScript中处理数组之reverse()方法的使用
2015/06/09 Javascript
jquery延迟对象解析
2016/10/26 Javascript
遍历json 对象的属性并且动态添加属性的实现
2016/12/02 Javascript
js实现图片上传预览原理分析
2017/07/13 Javascript
vue-cli webpack 引入swiper的操作方法
2018/09/15 Javascript
深入理解JavaScript 中的执行上下文和执行栈
2018/10/23 Javascript
jquery使用FormData实现异步上传文件
2018/10/25 jQuery
如何使用 vue-cli 创建模板项目
2020/11/19 Vue.js
Python使用urllib2获取网络资源实例讲解
2013/12/02 Python
举例讲解Python面向对象编程中类的继承
2016/06/17 Python
Python学习之Django的管理界面代码示例
2018/02/10 Python
使用NumPy和pandas对CSV文件进行写操作的实例
2018/06/14 Python
Python在for循环中更改list值的方法【推荐】
2018/08/17 Python
Python将8位的图片转为24位的图片实现方法
2018/10/24 Python
Django获取应用下的所有models的例子
2019/08/30 Python
python+django+rest框架配置创建方法
2019/08/31 Python
浅谈Tensorflow加载Vgg预训练模型的几个注意事项
2020/05/26 Python
美国沃尔玛网上超市:Walmart
2020/08/14 全球购物
瑞典最大的儿童用品网上商店:pinkorblue.se
2021/03/09 全球购物
广州品高软件.net笔面试题目
2012/04/18 面试题
事业单位分类改革实施方案
2014/03/21 职场文书
消防宣传口号
2014/06/16 职场文书
绘画专业自荐信
2014/07/04 职场文书
九一八事变纪念日演讲稿
2014/09/14 职场文书
幼儿园法制宣传日活动总结
2014/11/01 职场文书
高中政治教学反思
2016/02/23 职场文书
新西兰:最新留学学习计划书写作指南
2019/07/15 职场文书