python爬虫用scrapy获取影片的实例分析


Posted in Python onNovember 23, 2020

我们平时生活的娱乐中,看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论,有什么影片上映,好不好看之类的话题,没事的时候谈论电影是非常不错的话题。那么,一些好看的影片如果不去电影院的话,在其他地方看都会有大大小小的限制,今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist(your_project_name)

python爬虫用scrapy获取影片的实例分析

文件说明: 名称 | 作用 --|-- scrapy.cfg | 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py | 设置数据存储模板,用于结构化数据,如:Django的Model pipelines | 数据处理行为,如:一般结构化的数据持久化 settings.py | 配置文件,如:递归的层数、并发数,延迟下载等 spiders | 爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类,并继承scrapy.spiders.Spider

必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据,这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL;

start-urls: 蜘蛛开始爬行的URL列表;

parse(): 这是提取并解析刮下数据的方法;

下面的代码演示了蜘蛛代码的样子:

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用Tkinter显示网络图片的方法
Apr 24 Python
在Python中处理字符串之isdecimal()方法的使用
May 20 Python
Python导入oracle数据的方法
Jul 10 Python
numpy数组拼接简单示例
Dec 15 Python
Win10下python 2.7.13 安装配置方法图文教程
Sep 18 Python
[原创]Python入门教程4. 元组基本操作
Oct 31 Python
利用Python模拟登录pastebin.com的实现方法
Jul 12 Python
如何将你的应用迁移到Python3的三个步骤
Dec 22 Python
Python基于pygame实现单机版五子棋对战
Dec 26 Python
PyCharm GUI界面开发和exe文件生成的实现
Mar 04 Python
Python使用Pyqt5实现简易浏览器(最新版本测试过)
Apr 27 Python
基于PyInstaller各参数的含义说明
Mar 04 Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
详解anaconda安装步骤
Nov 23 #Python
You might like
从C/C++迁移到PHP——判断字符类型的函数
2006/10/09 PHP
php数组函数序列之end() - 移动数组内部指针到最后一个元素,并返回该元素的值
2011/10/31 PHP
Yii针对添加行的增删改查操作示例
2016/10/18 PHP
Kindeditor编辑器添加图片上传水印功能(php代码)
2017/08/03 PHP
js选取多个或单个元素的实现代码(用class)
2012/08/22 Javascript
JS对select控件option选项的增删改查示例代码
2013/10/21 Javascript
javascript实现文本域写入字符时限定字数
2014/02/12 Javascript
JavaScript加入收藏夹功能(兼容IE、firefox、chrome)
2014/05/05 Javascript
使用Angular和Nodejs、socket.io搭建聊天室及多人聊天室
2015/08/21 NodeJs
JS实现可自定义大小,可双击关闭的弹出层效果
2015/10/16 Javascript
浅谈webpack打包之后的文件过大的解决方法
2018/03/07 Javascript
vue2中使用less简易教程
2018/03/27 Javascript
Webpack中publicPath路径问题详解
2018/05/03 Javascript
使用jquery的cookie实现登录页记住用户名和密码的方法
2019/03/13 jQuery
微信小程序反编译的实现
2020/12/10 Javascript
JavaScript点击按钮生成4位随机验证码
2021/01/28 Javascript
[03:49]DOTA2英雄基础教程 光之守卫
2014/01/14 DOTA
python 获取本机ip地址的两个方法
2013/02/25 Python
Python 私有函数的实例详解
2017/09/11 Python
python批量下载网站马拉松照片的完整步骤
2018/12/05 Python
python中update的基本使用方法详解
2019/07/17 Python
对Django 中request.get和request.post的区别详解
2019/08/12 Python
python torch.utils.data.DataLoader使用方法
2020/04/02 Python
python zip,lambda,map函数代码实例
2020/04/04 Python
keras训练浅层卷积网络并保存和加载模型实例
2020/07/02 Python
Pycharm安装Qt Design快捷工具的详细教程
2020/11/18 Python
CSS3弹性盒模型开发笔记(三)
2016/04/26 HTML / CSS
Aveda美国官网:天然护发产品、洗发水、护发素和沙龙
2016/12/09 全球购物
新闻编辑专业自荐信
2014/07/02 职场文书
交通事故赔偿协议书
2014/10/16 职场文书
高中生毕业评语
2014/12/30 职场文书
课外活动总结
2015/02/04 职场文书
碧霞祠导游词
2015/02/09 职场文书
求职简历自我评价2015
2015/03/10 职场文书
2016年乡镇综治宣传月活动总结
2016/03/16 职场文书
使用canvas实现雪花飘动效果的示例代码
2021/03/30 HTML / CSS