Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python中的sort方法使用详解
Jul 25 Python
Python科学计算之NumPy入门教程
Jan 15 Python
python pyinstaller 加载ui路径方法
Jun 10 Python
Django接收自定义http header过程详解
Aug 23 Python
Python基于WordCloud制作词云图
Nov 29 Python
Python 动态变量名定义与调用方法
Feb 09 Python
python学生管理系统的实现
Apr 05 Python
Django中的AutoField字段使用
May 18 Python
Python celery原理及运行流程解析
Jun 13 Python
解决tensorflow读取本地MNITS_data失败的原因
Jun 22 Python
python+selenium实现12306模拟登录的步骤
Jan 21 Python
Windows安装Anaconda3的方法及使用过程详解
Jun 11 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
PHP多线程抓取网页实现代码
2010/07/22 PHP
PHP判断变量是否为0的方法
2014/02/08 PHP
php实现用于删除整个目录的递归函数
2015/03/16 PHP
为你总结一些php信息函数
2015/10/21 PHP
PHP安装threads多线程扩展基础教程
2015/11/17 PHP
php采用session实现防止页面重复刷新
2015/12/24 PHP
CodeIgniter基于Email类发邮件的方法
2016/03/29 PHP
JQuery 构建客户/服务分离的链接模型中Table中的排序分析
2010/01/22 Javascript
Javascript页面添加到收藏夹的简单方法
2013/08/07 Javascript
JS简单实现元素复制示例附图
2013/11/19 Javascript
详谈JavaScript 匿名函数及闭包
2014/11/14 Javascript
JS实现兼容各浏览器解析XML文档数据的方法
2015/06/01 Javascript
jquery移动点击的项目到列表最顶端的方法
2015/06/24 Javascript
浅谈Javascript实现继承的方法
2015/07/06 Javascript
如何用JS判断两个数字的大小
2016/07/21 Javascript
JS中的数组方法笔记整理
2016/07/26 Javascript
Angular懒加载机制刷新后无法回退的快速解决方法
2016/08/30 Javascript
jQuery实现磁力图片跟随效果完整示例
2016/09/16 Javascript
Vue.js双向绑定操作技巧(初级入门)
2016/12/27 Javascript
多个上传文件用js验证文件的格式和大小的方法(推荐)
2017/03/09 Javascript
nodejs个人博客开发第七步 后台登陆
2017/04/12 NodeJs
Node.js中多进程模块Cluster的介绍与使用
2017/05/27 Javascript
js canvas实现简单的图像扩散效果
2020/06/28 Javascript
原生JS获取元素的位置与尺寸实现方法
2017/10/18 Javascript
bootstrap-treeview实现多级树形菜单 后台JSON格式如何组织?
2019/07/26 Javascript
微信小程序 checkbox使用实例解析
2019/09/09 Javascript
[45:52]2018DOTA2亚洲邀请赛 4.1小组赛 A组加赛 LGD vs Liquid
2018/04/02 DOTA
Python如何应用cx_Oracle获取oracle中的clob字段问题
2019/08/27 Python
10个python3常用排序算法详细说明与实例(快速排序,冒泡排序,桶排序,基数排序,堆排序,希尔排序,归并排序,计数排序)
2020/03/17 Python
一款纯css3实现的鼠标悬停动画按钮
2014/12/29 HTML / CSS
技校毕业生的自我评价
2013/12/27 职场文书
总经理助理职责
2014/02/04 职场文书
初中教师个人工作总结
2015/02/10 职场文书
汤姆索亚历险记读书笔记
2015/06/29 职场文书
2015年小学生国庆节演讲稿
2015/07/30 职场文书
2016五一手机促销广告语
2016/01/28 职场文书