python爬虫用scrapy获取影片的实例分析


Posted in Python onNovember 23, 2020

我们平时生活的娱乐中,看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论,有什么影片上映,好不好看之类的话题,没事的时候谈论电影是非常不错的话题。那么,一些好看的影片如果不去电影院的话,在其他地方看都会有大大小小的限制,今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist(your_project_name)

python爬虫用scrapy获取影片的实例分析

文件说明: 名称 | 作用 --|-- scrapy.cfg | 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py | 设置数据存储模板,用于结构化数据,如:Django的Model pipelines | 数据处理行为,如:一般结构化的数据持久化 settings.py | 配置文件,如:递归的层数、并发数,延迟下载等 spiders | 爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类,并继承scrapy.spiders.Spider

必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据,这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL;

start-urls: 蜘蛛开始爬行的URL列表;

parse(): 这是提取并解析刮下数据的方法;

下面的代码演示了蜘蛛代码的样子:

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
深入理解Python中字典的键的使用
Aug 19 Python
Python 常用的安装Module方式汇总
May 06 Python
Python实现树的先序、中序、后序排序算法示例
Jun 23 Python
关于Python中浮点数精度处理的技巧总结
Aug 10 Python
matplotlib.pyplot绘图显示控制方法
Jan 15 Python
PYQT5实现控制台显示功能的方法
Jun 25 Python
python 梯度法求解函数极值的实例
Jul 10 Python
python将三维数组展开成二维数组的实现
Nov 30 Python
selenium+python实现自动登陆QQ邮箱并发送邮件功能
Dec 13 Python
Python实现获取当前目录下文件名代码详解
Mar 10 Python
Python3+PyCharm+Django+Django REST framework配置与简单开发教程
Feb 16 Python
python单向链表实例详解
May 25 Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
详解anaconda安装步骤
Nov 23 #Python
You might like
CI框架整合smarty步骤详解
2016/05/19 PHP
微信公众平台开发教程⑥ 微信开发集成类的使用图文详解
2019/04/10 PHP
PHP 加密 Password Hashing API基础知识点
2020/03/02 PHP
实现png图片和png背景透明(支持多浏览器)的方法
2009/09/08 Javascript
js 替换功能函数,用正则表达式解决,js的全部替换
2010/12/08 Javascript
javascript学习笔记(十九) 节点的操作实现代码
2012/06/20 Javascript
jquery获取div距离窗口和父级dv的距离示例
2013/10/10 Javascript
js禁止回车提交表单的示例代码
2013/12/23 Javascript
jquery ajaxSubmit 异步提交的简单实现
2014/02/28 Javascript
在JavaScript中重写jQuery对象的方法实例教程
2014/08/25 Javascript
Javascript中构造函数要注意的一些坑
2017/01/23 Javascript
详解angularjs中如何实现控制器和指令之间交互
2017/05/31 Javascript
vue2+el-menu实现路由跳转及当前项的设置方法实例
2017/11/07 Javascript
Vue CLI3搭建的项目中路径相关问题的解决
2018/09/17 Javascript
Angular6新特性之Angular Material
2018/12/28 Javascript
js中forEach,for in,for of循环的用法示例小结
2020/03/14 Javascript
python使用多线程不断刷新网页的方法
2015/03/31 Python
Python multiprocessing模块中的Pipe管道使用实例
2015/04/11 Python
python实现从ftp服务器下载文件的方法
2015/04/30 Python
CentOS中使用virtualenv搭建python3环境
2015/06/08 Python
Win10下python3.5和python2.7环境变量配置教程
2018/09/18 Python
python用列表生成式写嵌套循环的方法
2018/11/08 Python
python3使用print打印带颜色的字符串代码实例
2019/08/22 Python
HTML5之tabindex属性全面解析
2016/07/07 HTML / CSS
施华洛世奇匈牙利官网:SWAROVSKI匈牙利
2019/07/06 全球购物
自荐信的基本格式
2014/02/22 职场文书
80后职场人的职业生涯规划
2014/03/08 职场文书
学生自我评语大全
2014/04/18 职场文书
交通事故委托书范本精选
2014/10/04 职场文书
2014年学生会工作总结
2014/11/07 职场文书
创先争优个人总结
2015/03/04 职场文书
职称评定个人总结
2015/03/05 职场文书
储备店长岗位职责
2015/04/14 职场文书
同意落户证明
2015/06/19 职场文书
关于教师节的广播稿
2015/08/19 职场文书