python使用requests模块实现爬取电影天堂最新电影信息


Posted in Python onApril 03, 2019

requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。可以说,Requests 完全满足如今网络的需求。本文重点给大家介绍python使用requests模块实现爬取电影天堂最新电影信息,具体内容如下所示:

在抓取网络数据的时候,有时会用正则对结构化的数据进行提取,比如 href="https://www.1234.com"等。python的re模块的findall()函数会返回一个所有匹配到的内容的列表,在将数据存入数据库时,列表数据类型是不被允许的,而是需要将其转换为元组形式。下面看下,str/list/tuple三者之间怎么相互转换。

class forDatas:
  def __init__(self):
    pass
  def str_list_tuple(self):
    s = 'abcde12345'
    print('s:', s, type(s))
    # str to list
    l = list(s)
    print('l:', l, type(l))
    # str to tuple
    t = tuple(s)
    print('t:', t, type(t))
    # str转化为list/tuple,直接进行转换即可
    # 由list/tuple转换为str,则需要借助join()函数来实现
    # list to str
    s1 = ''.join(l)
    print('s1:', s1, type(s1))
    # tuple to str
    s2 = ''.join(t)
    print('s2:', s2, type(s2))

str转化为list/tuple,直接进行转换即可。而由list/tuple转换为str,则需要借助join()函数来实现。join()函数是这样描述的:

"""
    S.join(iterable) -> str
    
    Return a string which is the concatenation of the strings in the
    iterable. The separator between elements is S.
    """

join()函数使用时,传入一个可迭代对象,返回一个可迭代的字符串,该字符串元素之间的分隔符是“S”。

传入一个可迭代对象,可以使list,tuple,也可以是str。

s = 'asdf1234'
sss = '@'.join(s)
print(type(sss), sss)

总结

以上所述是小编给大家介绍的python使用requests模块实现爬取电影天堂最新电影信息,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python中list列表的高级函数
May 17 Python
在java中如何定义一个抽象属性示例详解
Aug 18 Python
Python网络爬虫中的同步与异步示例详解
Feb 03 Python
python itchat给指定联系人发消息的方法
Jun 11 Python
tensor和numpy的互相转换的实现示例
Aug 02 Python
python使用yield压平嵌套字典的超简单方法
Nov 02 Python
Python二次规划和线性规划使用实例
Dec 09 Python
解决IDEA 的 plugins 搜不到任何的插件问题
May 04 Python
Python matplotlib读取excel数据并用for循环画多个子图subplot操作
Jul 14 Python
Python通过getattr函数获取对象的属性值
Oct 16 Python
Django前后端分离csrf token获取方式
Dec 25 Python
解决numpy和torch数据类型转化的问题
May 23 Python
Python简直是万能的,这5大主要用途你一定要知道!(推荐)
Apr 03 #Python
Python3实现计算两个数组的交集算法示例
Apr 03 #Python
Python3获取拉勾网招聘信息的方法实例
Apr 03 #Python
Python3实现的旋转矩阵图像算法示例
Apr 03 #Python
python3对拉勾数据进行可视化分析的方法详解
Apr 03 #Python
python2.7使用plotly绘制本地散点图和折线图
Apr 02 #Python
Python时间序列处理之ARIMA模型的使用讲解
Apr 02 #Python
You might like
PHP中函数内引用全局变量的方法
2008/10/20 PHP
php 调试利器debug_print_backtrace()
2012/07/23 PHP
基于PHP CURL获取邮箱地址的详解
2013/06/03 PHP
php实现执行某一操作时弹出确认、取消对话框
2013/12/30 PHP
php数组中包含中文的排序方法
2014/06/03 PHP
jqPlot 基于jquery的画图插件
2011/04/26 Javascript
THREE.JS入门教程(5)你应当知道的十件事
2013/01/24 Javascript
查看大图功能代码jquery版
2013/11/05 Javascript
javascript面向对象快速入门实例
2015/01/13 Javascript
Javascript中的arguments与重载介绍
2015/03/15 Javascript
jquery实现图片上传之前预览的方法
2015/07/11 Javascript
javascript实现图片上传前台页面
2015/08/18 Javascript
javascript针对cookie的基本操作实例详解
2015/11/30 Javascript
JavaScript中的return语句简单介绍
2015/12/07 Javascript
jQuery插件ajaxFileUpload异步上传文件
2016/10/19 Javascript
bootstrap switch开关组件使用方法详解
2017/08/22 Javascript
深入理解vue-router之keep-alive
2017/08/31 Javascript
解决vue项目使用font-awesome,build后路径的问题
2018/09/01 Javascript
React Native开发封装Toast与加载Loading组件示例
2018/09/08 Javascript
socket io与vue-cli的结合使用的示例代码
2018/11/01 Javascript
webpack项目使用eslint建立代码规范实现
2019/05/16 Javascript
js中调用微信的扫描二维码功能的实现代码
2020/04/11 Javascript
vue-cli3项目打包后自动化部署到服务器的方法
2020/09/16 Javascript
js实现简易ATM功能
2020/10/27 Javascript
Python3读取zip文件信息的方法
2015/05/22 Python
浅谈python之新式类
2018/08/12 Python
nohup后台启动Python脚本,log不刷新的解决方法
2019/01/14 Python
深入浅析Python中的迭代器
2019/06/04 Python
Jupyter notebook设置背景主题,字体大小及自动补全代码的操作
2020/04/13 Python
Python改变对象的字符串显示的方法
2020/08/01 Python
python安装第三方库如xlrd的方法
2020/10/31 Python
pip 20.3 新版本发布!即将抛弃 Python 2.x(推荐)
2020/12/16 Python
Trina Turk官网:美国时装和泳装品牌
2018/06/10 全球购物
解释下面关于J2EE的名词
2013/11/15 面试题
总经理司机职责
2014/02/02 职场文书
就业推荐表导师评语
2014/12/31 职场文书