Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
利用aardio给python编写图形界面
Aug 21 Python
python3.0 模拟用户登录,三次错误锁定的实例
Nov 02 Python
python并发2之使用asyncio处理并发
Dec 21 Python
pandas.DataFrame选取/排除特定行的方法
Jul 03 Python
numpy的文件存储.npy .npz 文件详解
Jul 09 Python
符合语言习惯的 Python 优雅编程技巧【推荐】
Sep 25 Python
在python中bool函数的取值方法
Nov 01 Python
python中的线程threading.Thread()使用详解
Dec 17 Python
python 爬取疫情数据的源码
Feb 09 Python
基于TensorBoard中graph模块图结构分析
Feb 15 Python
python json 递归打印所有json子节点信息的例子
Feb 27 Python
python实现人像动漫化的示例代码
May 17 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
php 使用GD库为页面增加水印示例代码
2014/03/24 PHP
ThinkPHP 3.2 数据分页代码分享
2014/10/14 PHP
PHP多线程编程之管道通信实例分析
2015/03/07 PHP
PHP下载生成的csv文件及问题总结
2015/08/06 PHP
PHP swoole和redis异步任务实现方法分析
2019/08/12 PHP
jQuery用unbind方法去掉hover事件及其他方法介绍
2013/03/18 Javascript
按下Enter焦点移至下一个控件的实现js代码
2013/12/11 Javascript
Javascript基础教程之变量
2015/01/18 Javascript
js+HTML5实现canvas多种颜色渐变效果的方法
2015/06/05 Javascript
JS JSOP跨域请求实例详解
2016/07/04 Javascript
JavaScript读二进制文件并用ajax传输二进制流的方法
2016/07/18 Javascript
Bootstrap 实现查询的完美方法
2016/10/26 Javascript
JS正则表达式验证密码格式的集中情况总结
2017/02/23 Javascript
jQuery实现浏览器之间跳转并传递参数功能【支持中文字符】
2018/03/28 jQuery
微信小程序仿美团城市选择
2018/06/06 Javascript
一个Vue视频媒体多段裁剪组件的实现示例
2018/08/09 Javascript
微信小程序实现点击卡片 翻转效果
2019/09/04 Javascript
原生js canvas实现鼠标跟随效果
2020/08/02 Javascript
Python的Django框架安装全攻略
2015/07/15 Python
Python实现对百度云的文件上传(实例讲解)
2017/10/21 Python
python 识别图片中的文字信息方法
2018/05/10 Python
python实现键盘控制鼠标移动
2020/11/27 Python
对python requests发送json格式数据的实例详解
2018/12/19 Python
Python去除字符串前后空格的几种方法
2019/03/04 Python
Python调用C语言的实现
2019/07/26 Python
Windows10下Tensorflow2.0 安装及环境配置教程(图文)
2019/11/21 Python
python实现mean-shift聚类算法
2020/06/10 Python
Unix里面如何在后台运行程序
2016/10/14 面试题
毕业证丢失证明
2014/01/15 职场文书
中学教师教育感言
2014/02/21 职场文书
少先队学雷锋活动月总结
2014/03/09 职场文书
计算机专业毕业生求职信
2014/04/30 职场文书
2015年父亲节活动总结
2015/02/12 职场文书
css3 filter属性的使用简介
2021/03/31 HTML / CSS
Redis IP地址的绑定的实现
2021/05/08 Redis
Python编程中Python与GIL互斥锁关系作用分析
2021/09/15 Python