Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python 网络编程起步(Socket发送消息)
Sep 06 Python
python发腾讯微博代码分享
Jan 10 Python
python fabric实现远程操作和部署示例
Mar 25 Python
Python使用sorted排序的方法小结
Jul 28 Python
对python中array.sum(axis=?)的用法介绍
Jun 28 Python
对Python random模块打乱数组顺序的实例讲解
Nov 08 Python
Python多线程爬取豆瓣影评API接口
Oct 22 Python
Python 中@property的用法详解
Jan 15 Python
pytorch方法测试——激活函数(ReLU)详解
Jan 15 Python
python编程进阶之类和对象用法实例分析
Feb 21 Python
Python unittest工作原理和使用过程解析
Feb 24 Python
在matplotlib中改变figure的布局和大小实例
Apr 23 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
php压缩HTML函数轻松实现压缩html/js/Css及注意事项
2013/01/27 PHP
PHP封装的非对称加密RSA算法示例
2018/05/28 PHP
php使用curl模拟多线程实现批处理功能示例
2019/07/25 PHP
[原创]保存的js无法执行的解决办法
2007/02/25 Javascript
js 获取浏览器高度和宽度值(多浏览器)
2009/09/02 Javascript
asp.net HttpHandler实现图片防盗链
2009/11/09 Javascript
javascript学习笔记(六) Date 日期类型
2012/06/19 Javascript
JS在textarea光标处插入文本的小例子
2013/03/22 Javascript
Js点击弹出下拉菜单效果实例
2013/08/12 Javascript
JavaScript解析URL参数示例代码
2013/08/12 Javascript
JS实现控制表格单元格垂直对齐的方法
2015/03/30 Javascript
JavaScript中用于四舍五入的Math.round()方法讲解
2015/06/15 Javascript
浅谈JavaScript 标准对象
2016/06/02 Javascript
Angular2  NgModule 模块详解
2016/10/19 Javascript
详解Angularjs 如何自定义Img的ng-load 事件
2017/02/15 Javascript
javascript显示动态时间的方法汇总
2018/07/06 Javascript
nodejs基础之buffer缓冲区用法分析
2018/12/26 NodeJs
浅谈关于JS下大批量异步任务按顺序执行解决方案一点思考
2019/01/08 Javascript
vue+element表格导出为Excel文件
2019/09/26 Javascript
如何优雅地取消 JavaScript 异步任务
2020/03/22 Javascript
Python图片裁剪实例代码(如头像裁剪)
2017/06/21 Python
解决python中遇到字典里key值为None的情况,取不出来的问题
2018/10/17 Python
Python3获取电脑IP、主机名、Mac地址的方法示例
2019/04/11 Python
python实现的按要求生成手机号功能示例
2019/10/08 Python
PyCharm+Miniconda3安装配置教程详解
2021/02/16 Python
仿酷狗html5手机音乐播放器主要部分代码
2013/05/15 HTML / CSS
高清屏下canvas重置尺寸引发的问题的解决
2019/10/14 HTML / CSS
英国高街品牌:Miss Selfridge(塞尔弗里奇小姐)
2016/09/21 全球购物
欧缇丽美国官网:Caudalie美国
2016/12/31 全球购物
美国狗旅行和户外用品领先供应商:kurgo
2020/08/18 全球购物
30年同学聚会感言
2014/01/30 职场文书
《歌唱二小放牛郎》教学反思
2014/04/19 职场文书
2014年销售经理工作总结
2014/12/01 职场文书
漂亮妈妈观后感
2015/06/08 职场文书
幼儿园托班开学寄语(2016春季)
2015/12/03 职场文书
《植树问题》教学反思
2016/03/03 职场文书