Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python验证企业工商注册码
Oct 25 Python
浅谈flask截获所有访问及before/after_request修饰器
Jan 18 Python
TensorFlow实现Batch Normalization
Mar 08 Python
Python Logging 日志记录入门学习
Jun 02 Python
Python实现读写INI配置文件的方法示例
Jun 09 Python
python实现猜数字小游戏
Mar 24 Python
Python对ElasticSearch获取数据及操作
Apr 24 Python
pandas 数据索引与选取的实现方法
Jun 21 Python
Python实现个人微信号自动监控告警的示例
Jul 03 Python
Python实现淘宝秒杀功能的示例代码
Jan 19 Python
解决Jupyter-notebook不弹出默认浏览器的问题
Mar 30 Python
Python 游戏大作炫酷机甲闯关游戏爆肝数千行代码实现案例进阶
Oct 16 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
使用laravel和ECharts实现折线图效果的例子
2019/10/09 PHP
jQuery对象和DOM对象使用说明
2010/06/25 Javascript
JQuery处理json与ajax返回JSON实例代码
2014/01/03 Javascript
jsPDF导出pdf示例
2014/05/02 Javascript
将HTML格式的String转化为HTMLElement的实现方法
2014/08/07 Javascript
js上传图片及预览功能实例分析
2015/04/24 Javascript
Bootstrap插件全集
2016/07/18 Javascript
socket.io学习教程之深入学习篇(三)
2017/04/29 Javascript
jQuery制作input提示内容(兼容IE8以上)
2017/07/05 jQuery
VUE + UEditor 单图片跨域上传功能的实现方法
2018/02/08 Javascript
Vue2 模板template的四种写法总结
2018/02/23 Javascript
jQuery简单实现的HTML页面文本框模糊匹配查询功能完整示例
2018/05/09 jQuery
在Vue-cli里应用Vuex的state和mutations方法
2018/09/16 Javascript
深入理解react 组件类型及使用场景
2019/03/07 Javascript
基于jQuery的时间戳与日期间的转化
2019/06/21 jQuery
使用JavaScript获取Django模板指定键值数据
2020/05/27 Javascript
python爬虫框架scrapy实战之爬取京东商城进阶篇
2017/04/24 Python
python如何在列表、字典中筛选数据
2018/03/19 Python
python创建文件备份的脚本
2018/09/11 Python
python批量图片处理简单示例
2019/08/06 Python
Python编程快速上手——疯狂填词程序实现方法分析
2020/02/29 Python
Pandas读取csv时如何设置列名
2020/06/02 Python
python实现自动打卡的示例代码
2020/10/10 Python
你可能不熟练的十个前端HTML5经典面试题
2018/07/03 HTML / CSS
国际知名军事风格休闲装品牌:Alpha Industries(阿尔法工业)
2017/05/24 全球购物
Lime Crime官网:美国一家主打梦幻精灵系的彩妆品牌
2019/03/22 全球购物
智能室内花园:Click & Grow
2021/01/29 全球购物
如何利用find命令查找文件
2016/11/18 面试题
工程项目经理岗位职责
2013/12/15 职场文书
社会学专业学生职业规划书
2014/02/07 职场文书
技术总监管理岗位职责
2014/03/09 职场文书
医院党员公开承诺书
2014/08/30 职场文书
大专护理专业自荐信
2015/03/25 职场文书
幼儿园教师岗位职责
2015/04/02 职场文书
2015年城管执法工作总结
2015/07/23 职场文书
中国古风插画师排行榜:夏达第一,第三是阴阳师姑获鸟皮肤创作者
2022/03/18 国漫