Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python实现分析apache和nginx日志文件并输出访客ip列表的方法
Apr 04 Python
用python实现k近邻算法的示例代码
Sep 06 Python
OpenCV+Python识别车牌和字符分割的实现
Jan 31 Python
python+django+rest框架配置创建方法
Aug 31 Python
用python求一重积分和二重积分的例子
Dec 06 Python
Python发送手机动态验证码代码实例
Feb 28 Python
Python Socketserver实现FTP文件上传下载代码实例
Mar 27 Python
keras中模型训练class_weight,sample_weight区别说明
May 23 Python
Python实现疫情通定时自动填写功能(附代码)
May 27 Python
查找适用于matplotlib的中文字体名称与实际文件名对应关系的方法
Jan 05 Python
python3 kubernetes api的使用示例
Jan 12 Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
mysql建立外键
2006/11/25 PHP
php 注释规范
2012/03/29 PHP
thinkphp 多表 事务详解
2013/06/17 PHP
php批量添加数据与批量更新数据的实现方法
2014/12/16 PHP
PHP错误处理函数
2016/04/03 PHP
php array_key_exists() 与 isset() 的区别
2016/10/24 PHP
PHP PDOStatement::closeCursor讲解
2019/01/30 PHP
PHP call_user_func和call_user_func_array函数的简单理解与应用分析
2019/11/25 PHP
PHP 出现 http500 错误的解决方法
2021/03/09 PHP
javascript iframe编程相关代码
2009/12/28 Javascript
JavaScript 创建运动框架的实现代码
2013/05/08 Javascript
checkbox使用示例
2013/08/23 Javascript
document.getElementBy("id")与$("#id")有什么区别
2013/09/22 Javascript
js获取窗口相对于屏幕左边和上边的位置坐标
2014/05/15 Javascript
jQuery如何防止这种冒泡事件发生
2015/02/27 Javascript
Javascript代码实现仿实例化类
2015/04/03 Javascript
Prototype框架详解
2015/11/25 Javascript
ie下js不执行的几种可能
2017/02/28 Javascript
元素全屏的设置与监听实例
2017/11/28 Javascript
在vue项目中安装使用Mint-UI的方法
2017/12/27 Javascript
Vuex中mutations与actions的区别详解
2018/03/01 Javascript
使用weixin-java-miniapp配置进行单个小程序的配置详解
2019/03/29 Javascript
vue实现的多页面项目如何优化打包的步骤详解
2020/07/19 Javascript
Python3 使用selenium插件爬取苏宁商家联系电话
2019/12/23 Python
django美化后台django-suit的安装配置操作
2020/07/12 Python
荷兰电脑专场:Paradigit
2018/05/05 全球购物
速比涛英国官网:Speedo英国
2019/07/15 全球购物
为什么Runtime.exec(“ls”)没有任何输出?
2014/10/03 面试题
社区党员先进事迹
2014/01/22 职场文书
十八届三中全会个人学习材料
2014/02/13 职场文书
餐饮采购员岗位职责
2014/03/15 职场文书
优秀共产党员推荐材料
2014/12/18 职场文书
无婚姻登记记录证明
2015/06/18 职场文书
劳动模范获奖感言
2015/07/31 职场文书
nginx location中多个if里面proxy_pass的方法
2021/03/31 Servers
完美解决golang go get私有仓库的问题
2021/05/05 Golang