python爬虫用scrapy获取影片的实例分析


Posted in Python onNovember 23, 2020

我们平时生活的娱乐中,看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论,有什么影片上映,好不好看之类的话题,没事的时候谈论电影是非常不错的话题。那么,一些好看的影片如果不去电影院的话,在其他地方看都会有大大小小的限制,今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist(your_project_name)

python爬虫用scrapy获取影片的实例分析

文件说明: 名称 | 作用 --|-- scrapy.cfg | 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py | 设置数据存储模板,用于结构化数据,如:Django的Model pipelines | 数据处理行为,如:一般结构化的数据持久化 settings.py | 配置文件,如:递归的层数、并发数,延迟下载等 spiders | 爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类,并继承scrapy.spiders.Spider

必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据,这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL;

start-urls: 蜘蛛开始爬行的URL列表;

parse(): 这是提取并解析刮下数据的方法;

下面的代码演示了蜘蛛代码的样子:

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python编写屏幕截图程序方法
Feb 18 Python
使用Pyinstaller的最新踩坑实战记录
Nov 08 Python
Python处理文本换行符实例代码
Feb 03 Python
Python 3.x 安装opencv+opencv_contrib的操作方法
Apr 02 Python
Python实现12306火车票抢票系统
Jul 04 Python
python多进程并发demo实例解析
Dec 13 Python
python深copy和浅copy区别对比解析
Dec 26 Python
Python+OpenCV实现旋转文本校正方式
Jan 09 Python
python小程序之4名牌手洗牌发牌问题解析
May 15 Python
Python StringIO及BytesIO包使用方法解析
Jun 15 Python
解决Django响应JsonResponse返回json格式数据报错问题
Aug 09 Python
Django Admin后台模型列表页面如何添加自定义操作按钮
Nov 11 Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
详解anaconda安装步骤
Nov 23 #Python
You might like
亚洲咖啡有什么?亚洲咖啡产地介绍 亚洲咖啡有什么特点?
2021/03/05 新手入门
php addslashes 利用递归实现使用反斜线引用字符串
2013/08/05 PHP
PHP5中使用mysqli的prepare操作数据库的介绍
2019/03/18 PHP
JavaScript网页制作特殊效果用随机数
2007/05/22 Javascript
javascript 一个自定义长度的文本自动换行的函数
2007/08/19 Javascript
Jquery Ajax学习实例7 Ajax所有过程事件分析示例
2010/03/23 Javascript
jquery 学习笔记一
2010/04/07 Javascript
javascript 当前日期转化为中文的实现代码
2010/05/13 Javascript
Javascript公共脚本库系列(一): 弹出层脚本
2011/02/24 Javascript
jQuery ajax serialize()方法的使用以及常见问题解决
2013/01/27 Javascript
DOM 事件流详解
2015/01/20 Javascript
jQuery Ajax 实例代码 ($.ajax、$.post、$.get)
2016/04/29 Javascript
footer定位页面底部(代码分享)
2017/03/07 Javascript
AngularJS表单验证功能分析
2017/05/26 Javascript
深入理解Node.js中通用基础设计模式
2017/09/19 Javascript
Vue内部渲染视图的方法
2019/09/02 Javascript
vue实现把接口单独存放在一个文件方式
2020/08/13 Javascript
[57:28]2018DOTA2亚洲邀请赛 4.6 淘汰赛 TNC vs Liquid 第一场
2018/04/10 DOTA
详解Python使用simplejson模块解析JSON的方法
2016/03/24 Python
python 接口_从协议到抽象基类详解
2017/08/24 Python
Python的SimpleHTTPServer模块用处及使用方法简介
2018/01/22 Python
python入门:这篇文章带你直接学会python
2018/09/14 Python
Python实现账号密码输错三次即锁定功能简单示例
2019/03/29 Python
Python Selenium 设置元素等待的三种方式
2020/03/18 Python
Too Faced官网:美国知名彩妆品牌
2017/03/07 全球购物
美国轻奢时尚购物网站:REVOLVE(支持中文)
2020/07/18 全球购物
SQL Server的固定数据库角色都有哪些?对应的服务器权限有哪些?
2013/05/18 面试题
给朋友的道歉信
2014/01/09 职场文书
学生会干部自荐信
2014/02/04 职场文书
表彰大会主持词
2014/03/26 职场文书
希特勒的演讲稿
2014/05/23 职场文书
消防标语大全
2014/06/07 职场文书
全国爱眼日活动总结
2015/02/27 职场文书
建筑工地资料员岗位职责
2015/04/13 职场文书
2015年度个人业务工作总结
2015/04/27 职场文书
Python 中 Shutil 模块详情
2021/11/11 Python