Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
在Python中使用HTML模版的教程
Apr 29 Python
Python正则捕获操作示例
Aug 19 Python
python实现一个简单的并查集的示例代码
Mar 19 Python
Django学习笔记之ORM基础教程
Mar 27 Python
Python设计模式之简单工厂模式实例详解
Jan 22 Python
Python绘制三角函数图(sin\cos\tan)并标注特定范围的例子
Dec 04 Python
基于Python获取照片的GPS位置信息
Jan 20 Python
详解Django3中直接添加Websockets方式
Feb 12 Python
Python工程师必考的6个经典面试题
Jun 28 Python
python中如何写类
Jun 29 Python
总结python多进程multiprocessing的相关知识
Jun 29 Python
如何利用Python实现一个论文降重工具
Jul 09 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
超人钢铁侠联手合作?美漫作家呼吁DC漫威合作联动以抵抗疫情
2020/04/09 欧美动漫
输出控制类
2006/10/09 PHP
强烈声明: 不要使用(include/require)_once
2013/06/06 PHP
php ZipArchive压缩函数详解实例
2013/11/06 PHP
yii通过小物件生成view的方法
2016/10/08 PHP
php 判断字符串编码是utf-8 或gb2312实例
2016/11/01 PHP
PHP如何读取由JavaScript设置的Cookie
2017/03/22 PHP
yii gridview实现时间段筛选功能
2017/08/15 PHP
Laravel程序架构设计思路之使用动作类
2018/06/07 PHP
js自带函数备忘 数组
2006/12/29 Javascript
JavaScript中的稀疏数组与密集数组[译]
2012/09/17 Javascript
jquery修改网页背景颜色通过css方法实现
2014/06/06 Javascript
jQuery控制TR显示隐藏的三种常用方法
2014/08/21 Javascript
取得元素的左和上偏移量的方法
2014/09/17 Javascript
jQuery的ready方法详解
2014/11/27 Javascript
javascript实现确定和取消提示框效果
2015/07/10 Javascript
jQuery插件ajaxFileUpload使用详解
2017/01/10 Javascript
jQuery使用正则表达式替换dom元素标签用法示例
2017/01/16 Javascript
简单易懂的天气插件(代码分享)
2017/02/04 Javascript
JavaScript中三个等号和两个等号你了解多少
2017/07/04 Javascript
JavaScript实现图片无缝滚动效果
2017/07/07 Javascript
小程序测试后台服务的方法(ngrok)
2019/03/08 Javascript
JS实现求字符串中出现最多次数的字符和次数示例
2019/07/05 Javascript
Vue父组件如何获取子组件中的变量
2019/07/24 Javascript
webpack+vue-cil 中proxyTable配置接口地址代理操作
2020/07/18 Javascript
基于python的汉字转GBK码实现代码
2012/02/19 Python
python基于twisted框架编写简单聊天室
2018/01/02 Python
关于 Python opencv 使用中的 ValueError: too many values to unpack
2019/06/28 Python
完美解决Pycharm中matplotlib画图中文乱码问题
2021/01/11 Python
Python实现京东抢秒杀功能
2021/01/25 Python
会计电算化个人自我评价
2013/11/17 职场文书
土木工程专业推荐信
2014/02/19 职场文书
文明礼仪伴我行演讲稿
2014/05/12 职场文书
2014年秋季开学寄语
2014/08/02 职场文书
2015年元旦联欢晚会活动总结
2014/11/28 职场文书
2014年行政人事工作总结
2014/12/09 职场文书