Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
详解Python中的日志模块logging
Jun 19 Python
Python实现PS滤镜特效之扇形变换效果示例
Jan 26 Python
Python产生Gnuplot绘图数据的方法
Nov 09 Python
对django xadmin自定义菜单的实例详解
Jan 03 Python
python 字典操作提取key,value的方法
Jun 26 Python
Python基于Opencv来快速实现人脸识别过程详解(完整版)
Jul 11 Python
Python解压 rar、zip、tar文件的方法
Nov 19 Python
pytorch 求网络模型参数实例
Dec 30 Python
PyTorch加载预训练模型实例(pretrained)
Jan 17 Python
Python requests.post方法中data与json参数区别详解
Apr 30 Python
python_matplotlib改变横坐标和纵坐标上的刻度(ticks)方式
May 16 Python
Python通过format函数格式化显示值
Oct 17 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
PHP树的代码,可以嵌套任意层
2006/10/09 PHP
基于mysql的论坛(2)
2006/10/09 PHP
深入解析PHP的引用计数机制
2013/06/14 PHP
PHP生成不同颜色、不同大小的tag标签函数
2013/09/23 PHP
如何阻止网站被恶意反向代理访问(防网站镜像)
2014/03/18 PHP
学习php设计模式 php实现门面模式(Facade)
2015/12/07 PHP
PHP对象实例化单例方法
2017/01/19 PHP
PHP批量删除jQuery操作
2017/07/23 PHP
php7 参数、整形及字符串处理机制修改实例分析
2020/05/25 PHP
javascript parseInt 大改造
2009/09/27 Javascript
jquery上传插件fineuploader上传文件使用方法(jquery图片上传插件)
2013/12/05 Javascript
jQuery实现页面点击后退弹出提示框的方法
2016/08/24 Javascript
微信小程序 slider的简单实例
2017/04/19 Javascript
解决js相同的正则多次调用test()返回的值却不同的问题
2018/10/10 Javascript
[01:05:12]2014 DOTA2国际邀请赛中国区预选赛 TongFu VS CIS-GAME
2014/05/21 DOTA
python中的列表推导浅析
2014/04/26 Python
python抓取最新博客内容并生成Rss
2015/05/17 Python
python开发之list操作实例分析
2016/02/22 Python
Python的语言类型(详解)
2017/06/24 Python
pygame实现弹力球及其变速效果
2017/07/03 Python
Python Unittest自动化单元测试框架详解
2018/04/04 Python
python使用ddt过程中遇到的问题及解决方案【推荐】
2018/10/29 Python
python3.6生成器yield用法实例分析
2019/08/23 Python
python GUI库图形界面开发之PyQt5计数器控件QSpinBox详细使用方法与实例
2020/02/28 Python
python自动下载图片的方法示例
2020/03/25 Python
django执行数据库查询之后实现返回的结果集转json
2020/03/31 Python
html5需遵循的6个设计原则
2016/04/27 HTML / CSS
英国最大的线上保健品零售商之一:Vitamin Planet
2016/12/01 全球购物
什么时候需要进行强制类型转换
2016/09/03 面试题
英语文学专业学生的自我评价
2013/10/31 职场文书
个人思想理论学习的自我鉴定
2013/11/30 职场文书
转预备党员政审材料
2014/02/06 职场文书
七匹狼男装广告词
2014/03/21 职场文书
岗位竞聘书范文
2014/03/31 职场文书
2015年店长工作总结范文
2015/04/08 职场文书
新学期感想
2015/08/10 职场文书