Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python实现登陆知乎获得个人收藏并保存为word文件
Mar 16 Python
在MAC上搭建python数据分析开发环境
Jan 26 Python
python使用正则表达式匹配字符串开头并打印示例
Jan 11 Python
离线安装Pyecharts的步骤以及依赖包流程
Apr 23 Python
matplotlib绘图实例演示标记路径
Jan 23 Python
详解Python核心对象类型字符串
Feb 11 Python
Python 列表去重去除空字符的例子
Jul 20 Python
解决Django中调用keras的模型出现的问题
Aug 07 Python
Python使用pyyaml模块处理yaml数据
Apr 14 Python
python 调用Google翻译接口的方法
Dec 09 Python
Python实现数据的序列化操作详解
Jul 07 Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
php 阴历-农历-转换类代码
2012/01/16 PHP
使用PHP强制下载PDF文件示例
2014/01/17 PHP
PHP fopen()和 file_get_contents()应用与差异介绍
2014/03/19 PHP
PHP实现自动对图片进行滚动显示的方法
2015/03/12 PHP
php分割合并两个字符串的函数实例
2015/06/19 PHP
YII使用url组件美化管理的方法
2015/12/28 PHP
用php和jQuery来实现“顶”和“踩”的投票功能
2016/10/13 PHP
PHP实现的最大正向匹配算法示例
2017/12/19 PHP
ExtJS4中的requires使用方法示例介绍
2013/12/03 Javascript
简介AngularJS的视图功能应用
2015/06/17 Javascript
全面解析Bootstrap弹窗的实现方法
2015/12/01 Javascript
JS实现把鼠标放到链接上出现滚动文字的方法
2016/04/06 Javascript
js匿名函数作为函数参数详解
2016/06/01 Javascript
JS获取短信验证码倒计时的实现代码
2017/05/22 Javascript
详解webpack的proxyTable无效的解决方案
2018/06/15 Javascript
Django中更新多个对象数据与删除对象的方法
2015/07/17 Python
简述Python2与Python3的不同点
2018/01/21 Python
python xlsxwriter库生成图表的应用示例
2018/03/16 Python
python 列表降维的实例讲解
2018/06/28 Python
python制作mysql数据迁移脚本
2019/01/01 Python
使用Python3内置文档高效学习以及官方中文文档
2019/05/19 Python
对tensorflow中tf.nn.conv1d和layers.conv1d的区别详解
2020/02/11 Python
Python中实现一行拆多行和多行并一行的示例代码
2020/09/06 Python
使用canvas绘制贝塞尔曲线
2014/12/17 HTML / CSS
GNC健安喜美国官网:美国第一营养品牌
2016/07/22 全球购物
垃圾回收的优点和原理。并考虑2种回收机制
2016/10/16 面试题
2014端午节活动策划方案
2014/01/27 职场文书
竞争上岗实施方案
2014/03/21 职场文书
清明节网上祭英烈活动总结
2014/04/30 职场文书
小学优秀班集体申报材料
2014/05/25 职场文书
共产党员批评与自我批评
2014/10/15 职场文书
关于群众路线的心得体会
2014/11/05 职场文书
2014年幼儿园小班工作总结
2014/12/04 职场文书
JavaScript实现复选框全选功能
2021/04/11 Javascript
世界十大儿童漫画书排名,法国国宝漫画排第五,第二是轰动日本连环
2022/03/18 欧美动漫
SpringBoot项目多数据源及mybatis 驼峰失效的问题解决方法
2022/07/07 Java/Android