python爬取豆瓣电影TOP250数据


Posted in Python onMay 23, 2021

在执行程序前,先在MySQL中创建一个数据库"pachong"。

import pymysql
import requests
import re


#获取资源并下载
def resp(listURL):
    #连接数据库
    conn = pymysql.connect(
        host = '127.0.0.1',
        port = 3306,
        user = 'root',
        password = '******',  #数据库密码请根据自身实际密码输入
        database = 'pachong', 
        charset = 'utf8'
    )

    #创建数据库游标
    cursor = conn.cursor()

    #创建列表t_movieTOP250(执行sql语句)
    cursor.execute('create table t_movieTOP250(id INT PRIMARY KEY 												auto_increment NOT NULL ,movieName VARCHAR(20) NOT NULL 									,pictrue_address VARCHAR(100))')

    try:
        # 爬取数据
        for urlPath in listURL:
            # 获取网页源代码
            response = requests.get(urlPath)
            html = response.text

            # 正则表达式
            namePat = r'alt="(.*?)" src='
            imgPat = r'src="(.*?)" class='

            # 匹配正则(排名【用数据库中id代替,自动生成及排序】、电影名、电影海报(图片地址))
            res2 = re.compile(namePat)
            res3 = re.compile(imgPat)
            textList2 = res2.findall(html)
            textList3 = res3.findall(html)

            # 遍历列表中元素,并将数据存入数据库
            for i in range(len(textList3)):
                cursor.execute('insert into t_movieTOP250(movieName,pictrue_address) 									VALUES("%s","%s")' % (textList2[i],textList3[i]))

        #从游标中获取结果
        cursor.fetchall()

        #提交结果
        conn.commit()
        print("结果已提交")

    except Exception as e:
        #数据回滚
        conn.rollback()
        print("数据已回滚")

    #关闭数据库
    conn.close()

#top250所有网页网址
def page(url):
    urlList = []
    for i in range(10):
        num = str(25*i)
        pagePat = r'?start=' + num + '&filter='
        urL = url+pagePat
        urlList.append(urL)
    return urlList


if __name__ == '__main__':
    url = r"https://movie.douban.com/top250"
    listURL = page(url)
    resp(listURL)

结果如下图:

python爬取豆瓣电影TOP250数据

python爬取豆瓣电影TOP250数据

以上就是我的分享,如果有什么不足之处请指出,多交流,谢谢!

以上就是python爬取豆瓣电影TOP250数据的详细内容,更多关于python爬取豆瓣电影的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python基础入门详解(文件输入/输出 内建类型 字典操作使用方法)
Dec 08 Python
Python开发的单词频率统计工具wordsworth使用方法
Jun 25 Python
python3大文件解压和基本操作
Dec 15 Python
python3.7将代码打包成exe程序并添加图标的方法
Oct 11 Python
python误差棒图errorbar()函数实例解析
Feb 11 Python
keras实现VGG16 CIFAR10数据集方式
Jul 07 Python
python中not、and和or的优先级与详细用法介绍
Nov 03 Python
基于python爬取梨视频实现过程解析
Nov 09 Python
python将YUV420P文件转PNG图片格式的两种方法
Jan 22 Python
理解深度学习之深度学习简介
Apr 14 Python
python中的3种定义类方法
Nov 27 Python
Python可变集合和不可变集合的构造方法大全
Dec 06 Python
基于Python绘制子图及子图刻度的变换等的问题
聊聊pytorch测试的时候为何要加上model.eval()
May 23 #Python
PyTorch 如何自动计算梯度
May 23 #Python
解决numpy和torch数据类型转化的问题
May 23 #Python
Python 用户输入和while循环的操作
May 23 #Python
解决Tkinter中button按钮未按却主动执行command函数的问题
May 23 #Python
python tkinter Entry控件的焦点移动操作
May 22 #Python
You might like
PHP中利用substr_replace将指定两位置之间的字符替换为*号
2011/01/27 PHP
php在文件指定行中写入代码的方法
2012/05/23 PHP
解析:通过php socket并借助telnet实现简单的聊天程序
2013/06/18 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(五)
2014/06/23 PHP
JavaScript 关键字屏蔽实现函数
2009/08/02 Javascript
jQuery ui 1.7更新小结
2009/08/15 Javascript
Jquery 表格合并的问题分享
2011/09/17 Javascript
Javascript获取窗口(容器)的大小及位置参数列举及简要说明
2012/12/09 Javascript
在浏览器中打开或关闭JavaScript的方法
2015/06/03 Javascript
JavaScript数据结构与算法之集合(Set)
2016/01/29 Javascript
在nginx上部署vue项目(history模式)的方法
2017/12/28 Javascript
Vue CLI3搭建的项目中路径相关问题的解决
2018/09/17 Javascript
Node.js模拟发起http请求从异步转同步的5种用法
2018/09/26 Javascript
vue实例的选项总结
2020/06/09 Javascript
[10:24]郎朗助力完美“圣”典,天籁交织奏响序曲
2016/12/18 DOTA
Python 调用VC++的动态链接库(DLL)
2008/09/06 Python
Python实现队列的方法
2015/05/26 Python
对Pyhon实现静态变量全局变量的方法详解
2019/01/11 Python
Python基于Tensor FLow的图像处理操作详解
2020/01/15 Python
python中shell执行知识点
2020/05/06 Python
详解vscode实现远程linux服务器上Python开发
2020/11/10 Python
python opencv实现直线检测并测出倾斜角度(附源码+注释)
2020/12/31 Python
video.js支持m3u8格式直播的实现示例
2020/05/20 HTML / CSS
美国Rue La La闪购网站:奢侈品、中高档品牌限时折扣
2016/10/19 全球购物
PAUL HEWITT手表美国站:德国北部时尚生活配饰品牌,船锚元素
2017/11/18 全球购物
澳大利亚波西米亚风连衣裙在线商店:Fortunate One
2019/04/01 全球购物
美国高端牛仔品牌:Silver Jeans
2019/12/12 全球购物
英国家具、照明、家居用品网上商店:Wayfair.co.uk
2020/02/13 全球购物
汽车技术服务与营销专业在籍生自荐信
2013/09/28 职场文书
物流管理毕业生自荐信
2013/10/24 职场文书
班训口号大全
2014/06/18 职场文书
国际语言毕业生求职信
2014/07/08 职场文书
行政专员岗位职责范本
2014/08/26 职场文书
装修活动策划方案
2014/08/27 职场文书
2014年学生会工作总结
2014/11/07 职场文书
活动简报范文
2015/07/22 职场文书