Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python抓取网页内容示例分享
Feb 24 Python
Python中的装饰器用法详解
Jan 14 Python
Python2实现的LED大数字显示效果示例
Sep 04 Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 Python
Python pygorithm模块用法示例【常见算法测试】
Aug 16 Python
python实现名片管理系统项目
Apr 26 Python
使用Python调取任意数字资产钱包余额功能
Aug 15 Python
Python timeit模块的使用实践
Jan 13 Python
Python 统计位数为偶数的数字代码详解
Mar 15 Python
Python绘制组合图的示例
Sep 18 Python
pyx文件 生成pyd 文件用于 cython调用的实现
Mar 04 Python
python中Tkinter 窗口之输入框和文本框的实现
Apr 12 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
ThinkPHP中URL路径访问与模块控制器之间的关系
2014/08/23 PHP
php实现cookie加密的方法
2015/03/10 PHP
Yii视图操作之自定义分页实现方法
2016/07/14 PHP
PHP开发之用微信远程遥控服务器
2018/01/25 PHP
PHP-FPM 设置多pool及配置文件重写操作示例
2019/10/02 PHP
JQuery判断子iframe何时加载完成解决方案
2013/08/20 Javascript
iframe的父子窗口之间的对象相互调用基本用法
2013/09/03 Javascript
javascript正则表达式中的replace方法详解
2015/04/20 Javascript
纯JavaScript基于notie.js插件实现消息提示特效
2016/01/18 Javascript
移动端利用H5实现压缩图片上传功能
2017/03/29 Javascript
微信小程序 蓝牙的实现实例代码
2017/06/27 Javascript
js 倒计时(高效率服务器时间同步)
2017/09/12 Javascript
详解js中Array的方法及技巧
2018/09/12 Javascript
javascript实现计算指定范围内的质数示例
2018/12/29 Javascript
vue-cli2与vue-cli3在一台电脑共存的实现方法
2019/09/25 Javascript
vue自动化路由的实现代码
2019/09/30 Javascript
微信小程序后端(java)开发流程的详细步骤
2019/11/13 Javascript
js 获取扫码枪输入数据的方法
2020/06/10 Javascript
关于ES6尾调用优化的使用
2020/09/11 Javascript
[01:39](回顾)各路豪强针锋相对,几经鏖战四强产生
2014/07/01 DOTA
python paramiko实现ssh远程访问的方法
2013/12/03 Python
实例探究Python以并发方式编写高性能端口扫描器的方法
2016/06/14 Python
详解python3中zipfile模块用法
2018/06/18 Python
Python根据已知邻接矩阵绘制无向图操作示例
2018/06/23 Python
Python向excel中写入数据的方法
2019/05/05 Python
Python的几种主动结束程序方式
2019/11/22 Python
如何在 Matplotlib 中更改绘图背景的实现
2020/11/26 Python
捷克时尚网上商店:OTTO
2018/03/15 全球购物
大学生职业生涯规划书范文
2014/01/14 职场文书
加入学生会演讲稿
2014/04/24 职场文书
公司口号大全
2014/06/11 职场文书
手术室护士节演讲稿
2014/08/27 职场文书
2014领导班子正风肃纪思想汇报
2014/09/18 职场文书
维稳工作承诺书
2015/01/20 职场文书
《伯牙绝弦》教学反思
2016/02/16 职场文书
python爬取豆瓣电影TOP250数据
2021/05/23 Python