Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python生成词云的实现方法(推荐)
Jun 13 Python
PyQt5每天必学之日历控件QCalendarWidget
Apr 19 Python
django+echart绘制曲线图的方法示例
Nov 26 Python
python用pandas数据加载、存储与文件格式的实例
Dec 07 Python
python使用magic模块进行文件类型识别方法
Dec 08 Python
Python3中编码与解码之Unicode与bytes的讲解
Feb 28 Python
Python中字符串与编码示例代码
May 20 Python
Python TCP通信客户端服务端代码实例
Nov 21 Python
python扫描线填充算法详解
Feb 19 Python
Python 之 Json序列化嵌套类方式
Feb 27 Python
python应用Axes3D绘图(批量梯度下降算法)
Mar 25 Python
python字符串的index和find的区别详解
Jun 20 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
乐信RP2100的电路分析和打磨
2021/03/02 无线电
PHP调用三种数据库的方法(2)
2006/10/09 PHP
解析php多线程下载远程多个文件
2013/06/25 PHP
php 判断服务器操作系统的类型
2014/02/17 PHP
php实现用于删除整个目录的递归函数
2015/03/16 PHP
php 实现进制相互转换
2016/04/07 PHP
PHP通过加锁实现并发情况下抢码功能
2016/08/10 PHP
PHP Socket网络操作类定义与用法示例
2017/08/30 PHP
php制作圆形用户头像的实例_自定义封装类源代码
2017/09/18 PHP
Ext grid 添加右击菜单
2009/11/26 Javascript
javascript数组去掉重复
2011/05/12 Javascript
js 幻灯片的实现
2011/12/06 Javascript
几种延迟加载JS代码的方法加快网页的访问速度
2013/10/12 Javascript
JavaScript数字和字符串转换示例
2014/03/26 Javascript
js超时调用setTimeout和间歇调用setInterval实例分析
2015/01/28 Javascript
javascript实现Table间隔色以及选择高亮(和动态切换数据)的方法
2015/05/14 Javascript
jQuery插件EasyUI获取当前Tab中iframe窗体对象的方法
2016/08/05 Javascript
JS实现禁止鼠标右键的功能
2016/10/15 Javascript
详解用原生JavaScript实现jQuery的某些简单功能
2016/12/19 Javascript
使用canvas及js简单生成验证码方法
2017/04/02 Javascript
swiper动态改变滑动内容的实现方法
2018/01/17 Javascript
Vue 动态添加路由及生成菜单的方法示例
2019/06/20 Javascript
node.JS事件机制与events事件模块的使用方法详解
2020/02/06 Javascript
Element实现表格嵌套、多个表格共用一个表头的方法
2020/05/09 Javascript
在Vue中使用mockjs代码实例
2020/11/25 Vue.js
JavaScript实现点击自制菜单效果
2021/02/02 Javascript
Python之csv文件从MySQL数据库导入导出的方法
2018/06/21 Python
python清除函数占用的内存方法
2018/06/25 Python
使用pip发布Python程序的方法步骤
2018/10/11 Python
python binascii 进制转换实例
2019/06/12 Python
欧洲顶级的童装奢侈品购物网站:Bambini Fashion(面向全球)
2018/04/24 全球购物
COSETTE官网:奢华,每天
2020/03/22 全球购物
党员对照检查材料思想汇报
2014/09/16 职场文书
逃课打麻将检讨书
2014/10/05 职场文书
党的群众路线教育实践活动学习笔记范文
2014/11/06 职场文书
python实现ROA算子边缘检测算法
2021/04/05 Python