Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python正则表达式之作业计算器
Mar 18 Python
详解Python中heapq模块的用法
Jun 28 Python
Python+matplotlib+numpy绘制精美的条形统计图
Jan 02 Python
python生成圆形图片的方法
Mar 25 Python
Python带动态参数功能的sqlite工具类
May 26 Python
python集合是否可变总结
Jun 20 Python
pyqt5 lineEdit设置密码隐藏,删除lineEdit已输入的内容等属性方法
Jun 24 Python
Python程序打包工具py2exe和PyInstaller详解
Jun 28 Python
在TensorFlow中屏蔽warning的方式
Feb 04 Python
pandas中read_csv、rolling、expanding用法详解
Apr 21 Python
matplotlib部件之套索Lasso的使用
Feb 24 Python
python中的被动信息搜集
Apr 29 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
PHP_NETWORK_GETADDRESSES: GETADDRINFO FAILED问题解决办法
2014/05/04 PHP
浅析php中json_encode()和json_decode()
2014/05/25 PHP
用php+ajax新建流程(请假、进货、出货等)
2017/06/11 PHP
PHP7.1实现的AES与RSA加密操作示例
2018/06/15 PHP
jQuery jqgrid 对含特殊字符json 数据的 Java 处理方法
2011/01/01 Javascript
使用Sticker.js实现贴纸效果
2015/01/28 Javascript
理解JavaScript表单的基础知识
2016/01/25 Javascript
AngularJS 整理一些优化的小技巧
2016/08/18 Javascript
详解HTTPS 的原理和 NodeJS 的实现
2017/07/04 NodeJs
angularJS实现动态添加,删除div方法
2018/02/27 Javascript
纯javascript实现选择框的全选与反选功能
2019/04/08 Javascript
vue自定义switch开关组件,实现样式可自行更改
2019/11/01 Javascript
vue使用transition组件动画效果的实例代码
2021/01/28 Vue.js
python获取糗百图片代码实例
2013/12/18 Python
用Python生成器实现微线程编程的教程
2015/04/13 Python
python中利用队列asyncio.Queue进行通讯详解
2017/09/10 Python
python爬虫之模拟登陆csdn的实例代码
2018/05/18 Python
python实现简单tftp(基于udp协议)
2018/07/30 Python
Django+Xadmin构建项目的方法步骤
2019/03/06 Python
Python3进制之间的转换代码实例
2019/08/24 Python
python zip()函数使用方法解析
2019/10/31 Python
python 将dicom图片转换成jpg图片的实例
2020/01/13 Python
python GUI库图形界面开发之PyQt5信号与槽机制、自定义信号基础介绍
2020/02/25 Python
python topk()函数求最大和最小值实例
2020/04/02 Python
python判断all函数输出结果是否为true的方法
2020/12/03 Python
selenium判断元素是否存在的两种方法小结
2020/12/07 Python
科室工作个人总结的自我评价
2013/10/29 职场文书
酒店办公室文员岗位职责
2013/12/18 职场文书
开工仪式策划方案
2014/05/23 职场文书
扶贫办主任查摆“四风”问题个人对照检查材料思想汇报
2014/10/02 职场文书
网络管理员岗位职责
2015/02/12 职场文书
师范生见习总结范文
2015/06/23 职场文书
安全生产隐患排查制度
2015/08/05 职场文书
2016年校园植树节广播稿
2015/12/17 职场文书
人生哲理妙语30条:淡写流年,笑过人生
2019/09/04 职场文书
年会邀请函的格式及范文五篇
2019/11/02 职场文书