Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python检查字符串是否是正确ISBN的方法
Jul 11 Python
Python创建二维数组实例(关于list的一个小坑)
Nov 07 Python
PyQt5每天必学之带有标签的复选框
Apr 19 Python
用python简单实现mysql数据同步到ElasticSearch的教程
May 30 Python
flask-socketio实现WebSocket的方法
Jul 31 Python
python的concat等多种用法详解
Nov 28 Python
python pytest进阶之fixture详解
Jun 27 Python
Python实现CNN的多通道输入实例
Jan 17 Python
python函数enumerate,operator和Counter使用技巧实例小结
Feb 22 Python
Python configparser模块配置文件过程解析
Mar 03 Python
Django项目配置Memcached和Redis, 缓存选择哪个更有优势
Apr 06 Python
Python 机器学习工具包SKlearn的安装与使用
May 14 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
DedeCMS 核心类TypeLink.class.php摘要笔记
2010/04/07 PHP
php的POSIX 函数以及进程测试的深入分析
2013/06/03 PHP
CakePHP框架Model函数定义方法示例
2017/08/04 PHP
Avengerls vs KG BO3 第一场2.18
2021/03/10 DOTA
如何快速的呈现我们的网页的技巧整理
2007/07/01 Javascript
JS复制到剪贴板示例代码
2013/10/30 Javascript
jQuery中get()方法用法实例
2014/12/27 Javascript
jQuery插件slides实现无缝轮播图特效
2015/04/17 Javascript
jQuery编程中的一些核心方法简介
2015/08/14 Javascript
AngularJS优雅的自定义指令
2016/07/01 Javascript
Javascript字符串常用方法详解
2016/07/21 Javascript
javascript回到顶部特效
2016/07/30 Javascript
基于cssSlidy.js插件实现响应式手机图片轮播效果
2016/08/30 Javascript
微信小程序中子页面向父页面传值实例详解
2017/03/20 Javascript
AngularJS动态菜单操作指令
2017/04/25 Javascript
原生JS实现的雪花飘落动画效果
2018/05/03 Javascript
koa2+vue实现登陆及登录状态判断
2019/08/15 Javascript
VUE实现自身整体组件销毁的示例代码
2020/01/13 Javascript
D3.js 实现带伸缩时间轴拓扑图的示例代码
2020/01/20 Javascript
[52:08]DOTA2上海特级锦标赛主赛事日 - 3 败者组第三轮#2Fnatic VS OG第一局
2016/03/05 DOTA
python进阶教程之函数对象(函数也是对象)
2014/08/30 Python
Python遍历zip文件输出名称时出现乱码问题的解决方法
2015/04/08 Python
python实现从字典中删除元素的方法
2015/05/04 Python
可能是最全面的 Python 字符串拼接总结【收藏】
2018/07/09 Python
pytorch使用指定GPU训练的实例
2019/08/19 Python
Python while循环使用else语句代码实例
2020/02/07 Python
美国隐形眼镜零售商:LensPure
2019/03/10 全球购物
欧克利英国官网:Oakley英国
2019/08/24 全球购物
教师自我鉴定
2013/12/13 职场文书
思想专业自荐信范文
2013/12/25 职场文书
连锁酒店店长职责范本
2014/02/13 职场文书
学习优秀党员杨宗兴先进事迹材料思想汇报
2014/09/14 职场文书
党员个人批评与自我批评
2014/10/14 职场文书
2015年教学工作总结
2015/04/02 职场文书
选择比努力更重要?这是长期以来对“努力”的最大误解
2019/07/12 职场文书
go mod 安装依赖 unkown revision问题的解决方案
2021/05/06 Golang