python使用requests模块实现爬取电影天堂最新电影信息


Posted in Python onApril 03, 2019

requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。可以说,Requests 完全满足如今网络的需求。本文重点给大家介绍python使用requests模块实现爬取电影天堂最新电影信息,具体内容如下所示:

在抓取网络数据的时候,有时会用正则对结构化的数据进行提取,比如 href="https://www.1234.com"等。python的re模块的findall()函数会返回一个所有匹配到的内容的列表,在将数据存入数据库时,列表数据类型是不被允许的,而是需要将其转换为元组形式。下面看下,str/list/tuple三者之间怎么相互转换。

class forDatas:
  def __init__(self):
    pass
  def str_list_tuple(self):
    s = 'abcde12345'
    print('s:', s, type(s))
    # str to list
    l = list(s)
    print('l:', l, type(l))
    # str to tuple
    t = tuple(s)
    print('t:', t, type(t))
    # str转化为list/tuple,直接进行转换即可
    # 由list/tuple转换为str,则需要借助join()函数来实现
    # list to str
    s1 = ''.join(l)
    print('s1:', s1, type(s1))
    # tuple to str
    s2 = ''.join(t)
    print('s2:', s2, type(s2))

str转化为list/tuple,直接进行转换即可。而由list/tuple转换为str,则需要借助join()函数来实现。join()函数是这样描述的:

"""
    S.join(iterable) -> str
    
    Return a string which is the concatenation of the strings in the
    iterable. The separator between elements is S.
    """

join()函数使用时,传入一个可迭代对象,返回一个可迭代的字符串,该字符串元素之间的分隔符是“S”。

传入一个可迭代对象,可以使list,tuple,也可以是str。

s = 'asdf1234'
sss = '@'.join(s)
print(type(sss), sss)

总结

以上所述是小编给大家介绍的python使用requests模块实现爬取电影天堂最新电影信息,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
收藏整理的一些Python常用方法和技巧
May 18 Python
解读Python编程中的命名空间与作用域
Oct 16 Python
Python实现的随机森林算法与简单总结
Jan 30 Python
Python Numpy 数组的初始化和基本操作
Mar 13 Python
Python求解任意闭区间的所有素数
Jun 10 Python
Python操作配置文件ini的三种方法讲解
Feb 22 Python
通过celery异步处理一个查询任务的完整代码
Nov 19 Python
PyTorch-GPU加速实例
Jun 23 Python
浅谈keras中的后端backend及其相关函数(K.prod,K.cast)
Jun 29 Python
python批量检查两个对应的txt文件的行数是否一致的实例代码
Oct 31 Python
使用Python实现音频双通道分离
Dec 25 Python
pip/anaconda修改镜像源,加快python模块安装速度的操作
Mar 04 Python
Python简直是万能的,这5大主要用途你一定要知道!(推荐)
Apr 03 #Python
Python3实现计算两个数组的交集算法示例
Apr 03 #Python
Python3获取拉勾网招聘信息的方法实例
Apr 03 #Python
Python3实现的旋转矩阵图像算法示例
Apr 03 #Python
python3对拉勾数据进行可视化分析的方法详解
Apr 03 #Python
python2.7使用plotly绘制本地散点图和折线图
Apr 02 #Python
Python时间序列处理之ARIMA模型的使用讲解
Apr 02 #Python
You might like
为IP查询添加GOOGLE地图功能的代码
2010/08/08 PHP
PHP静态调用非静态方法的应用分析
2013/05/02 PHP
php中strtotime函数用法详解
2014/11/15 PHP
php查询相似度最高的字符串的方法
2015/03/12 PHP
详解WordPress中简码格式标签编写的基本方法
2015/12/22 PHP
CodeIgniter连贯操作的底层原理分析
2016/05/17 PHP
Ubuntu VPS中wordpress网站打开时提示”建立数据库连接错误”的解决办法
2016/11/03 PHP
如何做到打开一个页面,过几分钟自动转到另一页面
2007/04/20 Javascript
js屏蔽鼠标键盘(右键/Ctrl+N/Shift+F10/F11/F5刷新/退格键)
2013/01/24 Javascript
JavaScript版TAB选项卡效果实例
2013/08/16 Javascript
Knockout text绑定DOM的使用方法
2013/11/15 Javascript
Javascript Ajax异步读取RSS文档具体实现
2013/12/12 Javascript
js几秒以后倒计时跳转示例
2013/12/26 Javascript
js取得html iframe中的元素和变量值
2014/06/30 Javascript
jQuery中parents()和parent()的区别分析
2014/10/28 Javascript
JS获取各种宽度、高度的简单介绍
2014/12/19 Javascript
javascript中apply、call和bind的使用区别
2016/04/05 Javascript
jQuery Easyui Datagrid实现单行的上移下移及保存移动的结果
2016/08/15 Javascript
jquery实现ajax提交表单信息的简单方法(推荐)
2016/08/24 Javascript
jquery实现数字输入框
2017/02/22 Javascript
浅谈Postman解决token传参的问题
2018/03/31 Javascript
详解react、redux、react-redux之间的关系
2018/04/11 Javascript
LayUI动态设置checkbox不显示的解决方法
2019/09/02 Javascript
jQuery实现的移动端图片缩放功能组件示例
2020/05/01 jQuery
详解vite2.0配置学习(typescript版本)
2021/02/25 Javascript
python利用标准库如何获取本地IP示例详解
2017/11/01 Python
Python简单实现两个任意字符串乘积的方法示例
2018/04/12 Python
将pandas.dataframe的数据写入到文件中的方法
2018/12/07 Python
python矩阵/字典实现最短路径算法
2019/01/17 Python
CentOS7安装Python3的教程详解
2019/04/10 Python
印度尼西亚综合购物网站:Lazada印尼
2016/09/07 全球购物
美国购买体育、音乐会和剧院门票网站:SelectATicket
2019/09/08 全球购物
村优秀党员事迹材料
2014/01/15 职场文书
小学美术兴趣小组活动总结
2014/07/07 职场文书
工程造价专业求职信
2014/07/17 职场文书
JS高级程序设计之class继承重点详解
2022/07/07 Javascript