python批量爬取下载抖音视频


Posted in Python onJune 17, 2019

本文实例为大家分享了python批量爬取下载抖音视频的具体代码,供大家参考,具体内容如下

import os
import requests
import re
import sys
import asyncio
import aiohttp

headers = {
  'user-agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) '
         'Version/11.0 Mobile/15A372 Safari/604.1'
}

VIDEO_URLS, PAGE = [], 1


def get_info(url):
  """
  :param url: 用户的链接
  :return:返回name,dytk,user_id 参数
  """
  name = None
  dytk = None
  user_id = None
  try:
    response = requests.get(url, headers=headers)
    user_id = response.url.split('/')[5].split('?')[0]
    name = re.search(r'class="nickname">(.*?)<', response.text)[1]
    dytk = re.search(r"dytk: '(.*?)'", response.text)[1]
  except (TypeError, IndexError):
    sys.stdout.write('Waring:输入的链接错误')
  except requests.exceptions:
    sys.stdout.write('Waring:链接错误')
  finally:
    return name, user_id, dytk


def make_dir(name):
  """
  建立文件夹
  :param name: 用户名称
  :return:
  """
  if not os.path.isdir(name):
    os.mkdir(name)
  else:
    pass


def get_all_video(user_id, max_cursor, dytk):
  """
  获取视频的地址
  :param user_id:
  :param max_cursor:
  :param dytk:
  :return:
  """
  url = "https://www.amemv.com/aweme/v1/aweme/post/?"
  params = {'user_id': user_id,
       'count': 21,
       'max_cursor': max_cursor,
       'dytk': dytk}
  try:
    response = requests.get(url=url, params=params, headers=headers)
    if response.status_code == 200:
      datas = response.json()
      for data in datas['aweme_list']:
        name = data.get('share_info').get('share_desc')
        url = data.get('video').get('play_addr').get('url_list')[0].replace('playwm', 'play')
        VIDEO_URLS.append([name, url])
      if datas['has_more'] == 1 and datas.get('max_cursor') != 0:
        global PAGE
        print(f'收集第{PAGE}页视频')
        PAGE += 1
        return get_all_video(user_id, datas.get('max_cursor'), dytk)
      else:
        print('收集完成')
        return VIDEO_URLS
    else:
      print('状态码:', response.status_code)
      return None
  except Exception as e:
    print('Waring:', e)
    return


async def download_video(index, name, video_name, url):
  """
  下载视频
  :param index:  视频id
  :param name:  用户名称
  :param video_name: 视频名称
  :param url:   下载url
  :return:
  """
  print(f'正在下载第{index}个视频:{video_name}')
  video_path = '{}/{}.mp4'.format(name, video_name)
  if not os.path.isfile(video_path):
    try:
      async with aiohttp.ClientSession() as session:
        async with session.get(url=url, headers=headers, ssl=False) as response:
          with open(video_path, 'wb') as f:
            while True:
              chunk = await response.content.read(1024)
              f.write(chunk)
              if not chunk:
                break
            print(f'下载完成第{index}个视频:{video_name}')
    except Exception as e:
      print('waring:download faild', video_name, e)
      return
  else:
    print('文件已存在')


def main():
  url = 'http://v.douyin.com/dEorkn/'
  name, user_id, dytk = get_info(url)
  if not (name, user_id, dytk):
    return
  make_dir(name)
  get_all_video(user_id, 0, dytk)
  print(f'{name}:总共有{len(VIDEO_URLS)}个视频')
  tasks = []
  for index, item in enumerate(VIDEO_URLS, 1):
    video_name = item[0]
    url = item[1]
    tasks.append(asyncio.ensure_future(download_video(index, name, video_name, url)))
  loop = asyncio.get_event_loop()
  loop.run_until_complete(asyncio.wait(tasks))
  loop.run_until_complete(asyncio.sleep(0))
  loop.close()
  print(f'{name}视频下载完成!')


if __name__ == '__main__':
  main()

python批量爬取下载抖音视频

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中pandas.DataFrame对行与列求和及添加新行与列示例
Mar 12 Python
python模拟登录并且保持cookie的方法详解
Apr 04 Python
python进程管理工具supervisor的安装与使用教程
Sep 05 Python
python在线编译器的简单原理及简单实现代码
Feb 02 Python
Python用csv写入文件_消除空余行的方法
Jul 06 Python
python的pip安装以及使用教程
Sep 18 Python
Python多进程入门、分布式进程数据共享实例详解
Jun 03 Python
python 的 scapy库,实现网卡收发包的例子
Jul 23 Python
Python 一行代码能实现丧心病狂的功能
Jan 18 Python
python利用opencv实现SIFT特征提取与匹配
Mar 05 Python
Python爬取你好李焕英豆瓣短评生成词云的示例代码
Feb 24 Python
python实现图片批量压缩
Apr 24 Python
python批量下载抖音视频
Jun 17 #Python
Python基础学习之类与实例基本用法与注意事项详解
Jun 17 #Python
python文本数据处理学习笔记详解
Jun 17 #Python
python3+PyQt5 实现Rich文本的行编辑方法
Jun 17 #Python
Appium+python自动化之连接模拟器并启动淘宝APP(超详解)
Jun 17 #Python
python3+PyQt5 数据库编程--增删改实例
Jun 17 #Python
python3+PyQt5 创建多线程网络应用-TCP客户端和TCP服务器实例
Jun 17 #Python
You might like
PHP判断是否为空的几个函数对比
2015/04/21 PHP
php+ajax 实现输入读取数据库显示匹配信息
2015/10/08 PHP
Yii视图CGridView列表用法实例分析
2016/07/12 PHP
thinkPHP中U方法加密传递参数功能示例
2018/05/29 PHP
PHP7 echo和print语句实例用法
2019/02/15 PHP
php 中self,this的区别和操作方法实例分析
2019/11/04 PHP
js仿百度有啊通栏展示效果实现代码
2013/05/28 Javascript
js判断undefined类型示例代码
2014/02/10 Javascript
JQuery中属性过滤选择器用法实例分析
2015/05/18 Javascript
JavaScript中用getDate()方法返回指定日期的教程
2015/06/09 Javascript
Google 地图API资料整理及详细介绍
2016/08/06 Javascript
jQuery Validate验证表单时多个name相同的元素只验证第一个的解决方法
2016/12/24 Javascript
Avalonjs 实现简单购物车功能(实例代码)
2017/02/07 Javascript
Angular 4.X开发实践中的踩坑小结
2017/07/04 Javascript
说说AngularJS中的$parse和$eval的用法
2017/09/14 Javascript
js html实现计算器功能
2018/11/13 Javascript
Vue动态生成el-checkbox点击无法赋值的解决方法
2019/02/21 Javascript
node中使用es6/7/8(支持性与性能)
2019/03/28 Javascript
ES6箭头函数和扩展实例分析
2020/05/23 Javascript
Pandas探索之高性能函数eval和query解析
2017/10/28 Python
使用python写一个自动浏览文章的脚本实例
2019/12/05 Python
Django 限制访问频率的思路详解
2019/12/24 Python
使用HTML5 Canvas为图片填充颜色和纹理的教程
2016/03/21 HTML / CSS
英国最大的婴儿监视器网上商店:Baby Monitors Direct
2018/04/24 全球购物
奢华的意大利皮革手袋:Bene Handbags
2019/10/29 全球购物
.NET面试问题集
2015/12/08 面试题
介绍一下Linux中的链接
2016/05/28 面试题
汽车维修与检测专业应届生求职信
2013/11/12 职场文书
护士辞职信模板
2014/01/20 职场文书
12月红领巾广播稿
2014/02/13 职场文书
小学生开学第一课活动方案
2014/03/27 职场文书
青年文明号口号
2014/06/17 职场文书
党的生日演讲稿
2014/09/10 职场文书
企业管理制度设计时要注意的几种“常见病”!
2019/04/19 职场文书
SQL Server连接查询的实用教程
2021/04/07 SQL Server
教你怎么用python实现字符串转日期
2021/05/24 Python