编程 Python

python爬虫用scrapy获取影片的实例分析

Posted in Python onNovember 23, 2020

我们平时生活的娱乐中，看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论，有什么影片上映，好不好看之类的话题，没事的时候谈论电影是非常不错的话题。那么，一些好看的影片如果不去电影院的话，在其他地方看都会有大大小小的限制，今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist（your_project_name）

python爬虫用scrapy获取影片的实例分析

注意：一般创建爬虫文件时，以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类，并继承scrapy.spiders.Spider

必须定义name，即爬虫名，如果没有name，会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据，这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL；

start-urls: 蜘蛛开始爬行的URL列表；

parse(): 这是提取并解析刮下数据的方法；

下面的代码演示了蜘蛛代码的样子：

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python爬虫用scrapy获取影片的实例分析

- Author -

小妮浅浅

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

深入理解Python中字典的键的使用

Aug 19 Python

Python 常用的安装Module方式汇总

May 06 Python

Python实现树的先序、中序、后序排序算法示例

Jun 23 Python

关于Python中浮点数精度处理的技巧总结

Aug 10 Python

matplotlib.pyplot绘图显示控制方法

Jan 15 Python

PYQT5实现控制台显示功能的方法

Jun 25 Python

python 梯度法求解函数极值的实例

Jul 10 Python

python将三维数组展开成二维数组的实现

Nov 30 Python

selenium+python实现自动登陆QQ邮箱并发送邮件功能

Dec 13 Python

Python实现获取当前目录下文件名代码详解

Mar 10 Python

Python3+PyCharm+Django+Django REST framework配置与简单开发教程

Feb 16 Python

python单向链表实例详解

May 25 Python

python爬虫scrapy图书分类实例讲解

Nov 23 #Python

scrapy处理python爬虫调度详解

Nov 23 #Python

利用Python将多张图片合成视频的实现

Nov 23 #Python

Python系统公网私网流量监控实现流程

Nov 23 #Python

Python 调用 ES、Solr、Phoenix的示例代码

Nov 23 #Python

10个示例带你掌握python中的元组

Nov 23 #Python

详解anaconda安装步骤

Nov 23 #Python

You might like

CI框架整合smarty步骤详解

2016/05/19 PHP

微信公众平台开发教程⑥ 微信开发集成类的使用图文详解

2019/04/10 PHP

PHP 加密 Password Hashing API基础知识点

2020/03/02 PHP

实现png图片和png背景透明（支持多浏览器）的方法

2009/09/08 Javascript

js 替换功能函数，用正则表达式解决，js的全部替换

2010/12/08 Javascript

javascript学习笔记(十九) 节点的操作实现代码

2012/06/20 Javascript

jquery获取div距离窗口和父级dv的距离示例

2013/10/10 Javascript

js禁止回车提交表单的示例代码

2013/12/23 Javascript

jquery ajaxSubmit 异步提交的简单实现

2014/02/28 Javascript

在JavaScript中重写jQuery对象的方法实例教程

2014/08/25 Javascript

Javascript中构造函数要注意的一些坑

2017/01/23 Javascript

详解angularjs中如何实现控制器和指令之间交互

2017/05/31 Javascript

vue2+el-menu实现路由跳转及当前项的设置方法实例

2017/11/07 Javascript

Vue CLI3搭建的项目中路径相关问题的解决

2018/09/17 Javascript

Angular6新特性之Angular Material

2018/12/28 Javascript

js中forEach，for in，for of循环的用法示例小结

2020/03/14 Javascript

python使用多线程不断刷新网页的方法

2015/03/31 Python

Python multiprocessing模块中的Pipe管道使用实例

2015/04/11 Python

python实现从ftp服务器下载文件的方法

2015/04/30 Python

CentOS中使用virtualenv搭建python3环境

2015/06/08 Python

Win10下python3.5和python2.7环境变量配置教程

2018/09/18 Python

python用列表生成式写嵌套循环的方法

2018/11/08 Python

python3使用print打印带颜色的字符串代码实例

2019/08/22 Python

HTML5之tabindex属性全面解析

2016/07/07 HTML / CSS

施华洛世奇匈牙利官网：SWAROVSKI匈牙利

2019/07/06 全球购物

自荐信的基本格式

2014/02/22 职场文书

80后职场人的职业生涯规划

2014/03/08 职场文书

学生自我评语大全

2014/04/18 职场文书

交通事故委托书范本精选

2014/10/04 职场文书

2014年学生会工作总结

2014/11/07 职场文书

创先争优个人总结

2015/03/04 职场文书

职称评定个人总结

2015/03/05 职场文书

储备店长岗位职责

2015/04/14 职场文书

同意落户证明

2015/06/19 职场文书

关于教师节的广播稿

2015/08/19 职场文书