Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python的Twisted框架上手前所必须了解的异步编程思想
May 25 Python
python 把数据 json格式输出的实例代码
Oct 31 Python
Python脚本实时处理log文件的方法
Nov 21 Python
深入理解python对json的操作总结
Jan 05 Python
Python中turtle作图示例
Nov 15 Python
python通过微信发送邮件实现电脑关机
Jun 20 Python
Python单元测试简单示例
Jul 03 Python
Python中出现IndentationError:unindent does not match any outer indentation level错误的解决方法
Apr 18 Python
浅谈pyqt5中信号与槽的认识
Feb 17 Python
在python中画正态分布图像的实例
Jul 08 Python
python中hasattr()、getattr()、setattr()函数的使用
Aug 16 Python
浅谈Python里面None True False之间的区别
Jul 09 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
php 判断访客是否为搜索引擎蜘蛛的函数代码
2011/07/29 PHP
php 获取页面中指定内容的实现类
2014/01/23 PHP
PHP基于curl实现模拟微信浏览器打开微信链接的方法示例
2019/02/15 PHP
javascript 动态修改样式和层叠样式表代码
2010/04/27 Javascript
基于node.js的快速开发透明代理
2010/12/25 Javascript
跨域请求之jQuery的ajax jsonp的使用解惑
2011/10/09 Javascript
你必须知道的Javascript知识点之"单线程事件驱动"的使用
2013/04/23 Javascript
javaScript 动态访问JSon元素示例代码
2013/08/30 Javascript
基于jquery的网站幻灯片切换效果焦点图代码
2013/09/15 Javascript
php跨域调用json的例子
2013/11/13 Javascript
JavaScript中的prototype.bind()方法介绍
2014/04/04 Javascript
js获取元素相对窗口位置的实现代码
2014/09/28 Javascript
在javascript中随机数 math random如何生成指定范围数值的随机数
2015/10/21 Javascript
AngularJS基础 ng-csp 指令详解
2016/08/01 Javascript
微信小程序 scroll-view隐藏滚动条详解
2017/01/16 Javascript
JavaScript实现打印星型金字塔功能实例分析
2017/09/27 Javascript
vue2实现搜索结果中的搜索关键字高亮的代码
2018/08/29 Javascript
深入理解js A*寻路算法原理与具体实现过程
2018/12/13 Javascript
ES6知识点整理之对象解构赋值应用示例
2019/04/17 Javascript
JavaScript图片旋转效果实现方法详解
2020/06/28 Javascript
vue界面发送表情的实现代码
2020/09/11 Javascript
Python实现字符串中某个字母的替代功能
2019/10/21 Python
Django admin管理工具TabularInline类用法详解
2020/05/14 Python
Python3与fastdfs分布式文件系统如何实现交互
2020/06/23 Python
Python 实现 T00ls 自动签到脚本代码(邮件+钉钉通知)
2020/07/06 Python
matplotlib绘制正余弦曲线图的实现
2021/02/22 Python
英国版MAC彩妆品牌:Illamasqua
2018/04/18 全球购物
Dyson戴森波兰官网:Dyson.pl
2019/08/05 全球购物
nohup的用法
2012/11/26 面试题
学年自我鉴定范文
2013/10/01 职场文书
食品营养与检测应届生求职信
2013/11/08 职场文书
特种设备安全管理制度
2015/08/06 职场文书
css 中多种边框的实现小窍门
2021/04/07 HTML / CSS
浅谈Python数学建模之数据导入
2021/06/23 Python
Flutter集成高德地图并添加自定义Maker的实践
2022/04/07 Java/Android
微信小程序实现轮播图指示器
2022/06/25 Javascript