python爬虫用scrapy获取影片的实例分析


Posted in Python onNovember 23, 2020

我们平时生活的娱乐中,看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论,有什么影片上映,好不好看之类的话题,没事的时候谈论电影是非常不错的话题。那么,一些好看的影片如果不去电影院的话,在其他地方看都会有大大小小的限制,今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist(your_project_name)

python爬虫用scrapy获取影片的实例分析

文件说明: 名称 | 作用 --|-- scrapy.cfg | 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py | 设置数据存储模板,用于结构化数据,如:Django的Model pipelines | 数据处理行为,如:一般结构化的数据持久化 settings.py | 配置文件,如:递归的层数、并发数,延迟下载等 spiders | 爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类,并继承scrapy.spiders.Spider

必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据,这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL;

start-urls: 蜘蛛开始爬行的URL列表;

parse(): 这是提取并解析刮下数据的方法;

下面的代码演示了蜘蛛代码的样子:

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python的Django框架使用入门指引
Apr 15 Python
Python模拟登陆淘宝并统计淘宝消费情况的代码实例分享
Jul 04 Python
深入理解NumPy简明教程---数组3(组合)
Dec 17 Python
python虚拟环境virualenv的安装与使用
Dec 18 Python
详解python中的json的基本使用方法
Dec 21 Python
python selenium UI自动化解决验证码的4种方法
Jan 05 Python
python mysql断开重连的实现方法
Jul 26 Python
python批量图片处理简单示例
Aug 06 Python
Django框架 查询Extra功能实现解析
Sep 04 Python
matplotlib jupyter notebook 图像可视化 plt show操作
Apr 24 Python
Python脚本如何在bilibili中查找弹幕发送者
Jun 04 Python
利用python绘制正态分布曲线
Jan 04 Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
详解anaconda安装步骤
Nov 23 #Python
You might like
WordPress开发中用于获取近期文章的PHP函数使用解析
2016/01/05 PHP
ThinkPHP实现转换数据库查询结果数据到对应类型的方法
2017/11/16 PHP
JavaScript中也使用$美元符号来代替document.getElementById
2010/06/19 Javascript
Jquery中显示隐藏的实现代码分析
2011/07/26 Javascript
仿百度输入框智能提示的js代码
2013/08/22 Javascript
JS将所有对象s的属性复制给对象r(原生js+jquery)
2014/01/25 Javascript
JavaScript随机生成信用卡卡号的方法
2015/04/07 Javascript
jquery实现可自动收缩的TAB网页选项卡代码
2015/09/06 Javascript
JS根据生日月份和日期计算星座的简单实现方法
2016/11/24 Javascript
JS仿Base.js实现的继承示例
2017/04/07 Javascript
JS对象序列化成json数据和json数据转化为JS对象的代码
2017/08/23 Javascript
微信小程序tabBar用法实例详解
2017/12/04 Javascript
vue+iview 实现可编辑表格的示例代码
2018/10/31 Javascript
详解JS判断页面是在手机端还是在PC端打开的方法
2019/04/26 Javascript
vue-router 前端路由之路由传值的方式详解
2019/04/30 Javascript
vue源码nextTick使用及原理解析
2019/08/13 Javascript
layui 监听select选择 获取当前select的ID名称方法
2019/09/24 Javascript
vue学习笔记之过滤器的基本使用方法实例分析
2020/02/01 Javascript
Vue + Scss 动态切换主题颜色实现换肤的示例代码
2020/04/27 Javascript
jQuery实现的上拉刷新功能组件示例
2020/05/01 jQuery
[04:46]2018年度玩家喜爱的电竞媒体-完美盛典
2018/12/16 DOTA
[01:14:19]NAVI vs Mineski 2019国际邀请赛淘汰赛 败者组BO1 8.20.mp4
2020/07/19 DOTA
Opencv+Python实现图像运动模糊和高斯模糊的示例
2019/04/11 Python
Django 中自定义 Admin 样式与功能的实现方法
2019/07/04 Python
PyQt使用QPropertyAnimation开发简单动画
2020/04/02 Python
稀有和绝版书籍:Biblio.com
2017/02/02 全球购物
Clarks鞋法国官方网站:英国其乐鞋品牌
2018/02/11 全球购物
沙特阿拉伯电子产品和家用电器购物网站:Black Box
2019/07/24 全球购物
德国、奥地利和瑞士最大的旅行和度假门户网站:HolidayCheck
2019/11/14 全球购物
自我评价个人范文
2013/12/16 职场文书
心碎乌托邦的创业计划书范文
2013/12/26 职场文书
思想汇报格式
2014/01/05 职场文书
党校培训自我鉴定范文
2014/03/20 职场文书
篮球赛口号
2014/06/18 职场文书
故意伤害辩护词
2015/05/21 职场文书
保安辞职申请书应该怎么写?
2019/07/15 职场文书