Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
利用打码兔和超人打码自封装的打码类分享
Mar 16 Python
从零学Python之hello world
May 21 Python
python执行shell获取硬件参数写入mysql的方法
Dec 29 Python
python查询sqlite数据表的方法
May 08 Python
Python xlwt设置excel单元格字体及格式
Apr 18 Python
Python XML转Json之XML2Dict的使用方法
Jan 15 Python
Python脚本修改阿里云的访问控制列表的方法
Mar 08 Python
如何使用python操作vmware
Jul 27 Python
python实现一个函数版的名片管理系统过程解析
Aug 27 Python
python图形绘制奥运五环实例讲解
Sep 14 Python
PyCharm更改字体和界面样式的方法步骤
Sep 27 Python
django API 中接口的互相调用实例
Apr 01 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
介绍几个array库的新函数 php
2006/12/29 PHP
smarty中先strip_tags过滤html标签后truncate截取文章运用
2010/10/25 PHP
php获取给定日期相差天数的方法分析
2017/02/20 PHP
php + WebUploader实现图片批量上传功能
2019/05/06 PHP
PHP isset empty函数相关面试题及解析
2020/12/11 PHP
可以支持多中格式的JS键盘
2007/05/02 Javascript
深入理解JavaScript系列(6):S.O.L.I.D五大原则之单一职责SRP
2012/01/15 Javascript
jQuery学习笔记之基础中的基础
2015/01/19 Javascript
jquery mobile 移动web(5)
2015/12/20 Javascript
使用jQuery判断Div是否在可视区域的方法 判断div是否可见
2016/02/17 Javascript
vue2.0 自定义 饼状图 (Echarts)组件的方法
2018/03/02 Javascript
Node.js利用console输出日志文件的方法示例
2018/04/27 Javascript
React+Webpack快速上手指南(小结)
2018/08/15 Javascript
解决vue 界面在苹果手机上滑动点击事件等卡顿问题
2018/11/27 Javascript
JavaScript设计模式之装饰者模式实例详解
2019/01/17 Javascript
ES6 Promise对象的应用实例分析
2019/06/27 Javascript
[02:10]探秘浦东源深体育馆 DOTA2 Supermajor不见不散
2018/05/17 DOTA
[01:05:52]DOTA2-DPC中国联赛 正赛 Ehome vs Aster BO3 第一场 2月2日
2021/03/11 DOTA
Python自动化部署工具Fabric的简单上手指南
2016/04/19 Python
详解Python 序列化Serialize 和 反序列化Deserialize
2017/08/20 Python
python 字典操作提取key,value的方法
2019/06/26 Python
python实现输出一个序列的所有子序列示例
2019/11/18 Python
使用python+whoosh实现全文检索
2019/12/09 Python
Python如何在DataFrame增加数值
2020/02/14 Python
在vscode中启动conda虚拟环境的思路详解
2020/12/25 Python
CSS3 渐变(Gradients)之CSS3 径向渐变
2016/07/08 HTML / CSS
劳力士官方珠宝商:J.R. Dunn Jewelers
2018/09/29 全球购物
英国礼品和生活方式品牌:Treat Republic
2020/11/21 全球购物
西安启天科技有限公司网络工程师面试题笔试题
2016/06/12 面试题
办公室内勤工作职责
2013/12/11 职场文书
简历中个人自我评价分享
2014/03/15 职场文书
家庭贫困证明书(3篇)
2014/09/15 职场文书
妈妈别哭观后感
2015/06/08 职场文书
2016优秀员工先进事迹材料
2016/02/25 职场文书
SpringBoot整合MongoDB的实现步骤
2021/06/23 MongoDB
Python使用pandas导入csv文件内容的示例代码
2022/12/24 Python