Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
使用Python实现一个简单的项目监控
Mar 31 Python
Python wxPython库Core组件BoxSizer用法示例
Sep 03 Python
对Pandas DataFrame缺失值的查找与填充示例讲解
Nov 06 Python
python 常见字符串与函数的用法详解
Nov 23 Python
Python给定一个句子倒序输出单词以及字母的方法
Dec 20 Python
selenium+python自动化测试环境搭建步骤
Jun 03 Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 Python
Python正则表达式匹配数字和小数的方法
Jul 03 Python
python使用Geany编辑器配置方法
Feb 21 Python
Python远程方法调用实现过程解析
Jul 28 Python
matplotlib对象拾取事件处理的实现
Jan 14 Python
Python实现日志实时监测的示例详解
Apr 06 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
PHP会话控制:Session与Cookie详解
2014/09/27 PHP
php+ajax实现文件切割上传功能示例
2020/03/03 PHP
JavaScript初学者需要了解10个小技巧
2010/08/25 Javascript
在次封装easyui-Dialog插件实现代码
2010/11/14 Javascript
javascript面向对象包装类Class封装类库剖析
2013/01/24 Javascript
js对列表中第一个值处理与jsp页面对列表中第一个值处理的区别详解
2013/11/05 Javascript
解决Jquery鼠标经过不停滑动的问题
2014/03/03 Javascript
JavaScript学习笔记之Function对象
2015/01/22 Javascript
Javascript中获取对象的原型对象的方法小结
2015/02/25 Javascript
JS验证IP,子网掩码,网关和MAC的方法
2015/07/02 Javascript
JavaScript生成SQL查询表单的方法
2015/08/13 Javascript
jQuery延迟执行的实现方法
2016/12/21 Javascript
原生JS改变透明度实现轮播效果
2017/03/24 Javascript
深入理解Node内建模块和对象
2019/03/12 Javascript
微信小程序实现录制、试听、上传音频功能(带波形图)
2020/02/27 Javascript
微信小程序间使用navigator跳转传值问题实例分析
2020/03/27 Javascript
请求时token过期自动刷新token操作
2020/09/11 Javascript
[52:22]EG vs VG Supermajor小组赛B组 BO3 第一场 6.2
2018/06/03 DOTA
[01:33:30]DOTA2-DPC中国联赛 正赛 RNG vs Phoenix BO3 第二场 2月5日
2021/03/11 DOTA
简单介绍Python中的JSON使用
2015/04/28 Python
对Python多线程读写文件加锁的实例详解
2019/01/14 Python
Python lambda表达式filter、map、reduce函数用法解析
2019/09/11 Python
pytorch 彩色图像转灰度图像实例
2020/01/13 Python
Python用access判断文件是否被占用的实例方法
2020/12/17 Python
详解Python 中的 defaultdict 数据类型
2021/02/22 Python
Kenneth Cole官网:纽约时尚优雅品牌
2016/11/14 全球购物
英国最大的网上药品商店:Chemist Direct
2017/12/16 全球购物
测绘工程专业个人自我评价
2013/12/01 职场文书
大学生新学期计划书
2014/04/28 职场文书
质量管理标语
2014/06/12 职场文书
公安机关查摆剖析材料
2014/10/10 职场文书
企业三严三实学习心得体会
2014/10/13 职场文书
人事主管岗位职责
2015/02/04 职场文书
安全知识竞赛主持词
2015/06/30 职场文书
Python数据清洗工具之Numpy的基本操作
2021/04/22 Python
golang 实现对Map进行键值自定义排序
2021/04/28 Golang