Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python实现数组插入新元素的方法
May 22 Python
matplotlib.pyplot画图 图片的二进制流的获取方法
May 24 Python
Python爬取数据并写入MySQL数据库的实例
Jun 21 Python
详解Python3中setuptools、Pip安装教程
Jun 18 Python
Python 中的参数传递、返回值、浅拷贝、深拷贝
Jun 25 Python
Python的log日志功能及设置方法
Jul 11 Python
python批量处理文件或文件夹
Jul 28 Python
Python 文件操作之读取文件(read),文件指针与写入文件(write),文件打开方式示例
Sep 29 Python
基于python的itchat库实现微信聊天机器人(推荐)
Oct 29 Python
Python 一行代码能实现丧心病狂的功能
Jan 18 Python
python3.6中anaconda安装sklearn踩坑实录
Jul 28 Python
pytorch下的unsqueeze和squeeze的用法说明
Feb 06 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
PHP实现的简单日历类
2014/11/29 PHP
yii2多图上传组件的使用教程
2018/05/10 PHP
layui框架实现文件上传及TP3.2.3(thinkPHP)对上传文件进行后台处理操作示例
2018/05/12 PHP
发布一个高效的JavaScript分析、压缩工具 JavaScript Analyser
2007/11/30 Javascript
js 编程笔记 无名函数
2011/06/28 Javascript
Jquery实现鼠标移上弹出提示框、移出消失思路及代码
2013/05/19 Javascript
捕获键盘事件(且兼容各浏览器)
2013/07/03 Javascript
JS+DIV+CSS实现仿表单下拉列表效果
2015/08/18 Javascript
Jquery实现遮罩层的简单实例(就是弹出DIV周围都灰色不能操作)
2016/07/14 Javascript
jQuery多个版本和其他js库冲突的解决方法
2016/08/11 Javascript
JavaScript中 ES6 generator数据类型详解
2016/08/11 Javascript
Bootstrap Img 图片样式(推荐)
2016/12/13 Javascript
js + css实现标签内容切换功能(实例讲解)
2017/10/09 Javascript
js html实现计算器功能
2018/11/13 Javascript
vue路由中前进后退的一些事儿
2019/05/18 Javascript
Vue利用Blob下载原生二进制数组文件
2019/09/25 Javascript
Python冲顶大会 快来答题!
2018/01/17 Python
django文档学习之applications使用详解
2018/01/29 Python
浅析Python 3 字符串中的 STR 和 Bytes 有什么区别
2018/10/14 Python
python socket 聊天室实例代码详解
2019/11/14 Python
Python实现图片批量加入水印代码实例
2019/11/30 Python
Python3的socket使用方法详解
2020/02/18 Python
python实现双人五子棋(终端版)
2020/12/30 Python
卡骆驰新加坡官网:Crocs新加坡
2018/06/12 全球购物
什么是SQL Server的确定性函数和不确定性函数
2016/08/04 面试题
高中生学期学习自我评价
2014/02/24 职场文书
交通事故调解协议书
2014/04/16 职场文书
政府绩效管理实施方案
2014/05/04 职场文书
校运动会广播稿300字
2014/10/07 职场文书
店铺转让协议书
2015/01/29 职场文书
2015年小学数学教师工作总结
2015/05/20 职场文书
合同纠纷调解书
2015/05/20 职场文书
2015年大学组织委员个人工作总结
2015/10/23 职场文书
2019最新劳动仲裁申请书!
2019/07/08 职场文书
Java Kafka 消费积压监控的示例代码
2021/07/01 Java/Android
Python  lambda匿名函数和三元运算符
2022/04/19 Python