python爬虫用scrapy获取影片的实例分析


Posted in Python onNovember 23, 2020

我们平时生活的娱乐中,看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论,有什么影片上映,好不好看之类的话题,没事的时候谈论电影是非常不错的话题。那么,一些好看的影片如果不去电影院的话,在其他地方看都会有大大小小的限制,今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist(your_project_name)

python爬虫用scrapy获取影片的实例分析

文件说明: 名称 | 作用 --|-- scrapy.cfg | 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py | 设置数据存储模板,用于结构化数据,如:Django的Model pipelines | 数据处理行为,如:一般结构化的数据持久化 settings.py | 配置文件,如:递归的层数、并发数,延迟下载等 spiders | 爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类,并继承scrapy.spiders.Spider

必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据,这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL;

start-urls: 蜘蛛开始爬行的URL列表;

parse(): 这是提取并解析刮下数据的方法;

下面的代码演示了蜘蛛代码的样子:

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python求斐波那契数列示例分享
Feb 14 Python
python开发之thread实现布朗运动的方法
Nov 11 Python
python利用正则表达式排除集合中字符的功能示例
Oct 10 Python
Python通过Pygame绘制移动的矩形实例代码
Jan 03 Python
pandas series序列转化为星期几的实例
Apr 11 Python
python2.x实现人民币转大写人民币
Jun 20 Python
用python 实现在不确定行数情况下多行输入方法
Jan 28 Python
python 二维矩阵转三维矩阵示例
Nov 30 Python
浅谈pytorch池化maxpool2D注意事项
Feb 18 Python
Python单例模式的四种创建方式实例解析
Mar 04 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 Python
Python趣味爬虫之用Python实现智慧校园一键评教
May 28 Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
详解anaconda安装步骤
Nov 23 #Python
You might like
第一节--面向对象编程
2006/11/16 PHP
php不用内置函数对数组排序的两个算法代码
2010/02/08 PHP
PHP使用内置函数生成图片的方法详解
2016/05/09 PHP
php实现用户注册密码的crypt加密
2017/06/08 PHP
php 自定义函数实现将数据 以excel 表格形式导出示例
2019/11/13 PHP
jQuery 使用手册(一)
2009/09/23 Javascript
DIY jquery plugin - tabs标签切换实现代码
2010/12/11 Javascript
javascript实现判断鼠标的状态
2015/07/10 Javascript
jQuery form插件的使用之处理server返回的JSON, XML,HTML数据
2016/01/26 Javascript
jQuery 获取多选框的值及多选框中文的函数
2016/05/16 Javascript
NodeJS整合银联网关支付(DEMO)
2016/11/09 NodeJs
JS基于递归算法实现1,2,3,4,5,6,7,8,9倒序放入数组中的方法
2017/01/03 Javascript
实现一个简单的vue无限加载指令方法
2017/01/10 Javascript
Angular1.x自定义指令实例详解
2017/03/01 Javascript
详解vue-cli之webpack3构建全面提速优化
2017/12/25 Javascript
JavaScript实现创建自定义对象的常用方式总结
2018/07/09 Javascript
javascript中floor使用方法总结
2019/02/02 Javascript
Node.js API详解之 dgram模块用法实例分析
2020/06/05 Javascript
vue键盘事件点击事件加native操作
2020/07/27 Javascript
javascript实现点击按钮切换轮播图功能
2020/09/23 Javascript
[02:28]DOTA2亚洲邀请赛附加赛 RECAP赛事回顾
2015/01/29 DOTA
python中使用sys模板和logging模块获取行号和函数名的方法
2014/04/15 Python
Python实现判断一个字符串是否包含子串的方法总结
2017/11/21 Python
详解Python自建logging模块
2018/01/29 Python
Python get获取页面cookie代码实例
2018/09/12 Python
对python Tkinter Text的用法详解
2018/10/11 Python
Python2和Python3中urllib库中urlencode的使用注意事项
2018/11/26 Python
对Python模块导入时全局变量__all__的作用详解
2019/01/11 Python
HTML5中新标签和常用标签详解
2014/03/07 HTML / CSS
如何使用canvas绘制可移动网格的示例代码
2020/12/14 HTML / CSS
意大利网上药房:Farmacia 33
2020/01/27 全球购物
新员工入职感言
2014/02/01 职场文书
《飞向蓝天的恐龙》教学反思
2014/04/09 职场文书
交通事故协议书范文
2014/04/16 职场文书
安全在我心中演讲稿
2014/09/01 职场文书
2015年事业单位工作总结
2015/04/27 职场文书