使用python3批量下载rbsp数据的示例代码


Posted in Python onDecember 20, 2019

1. 原始网站
https://www.rbsp-ect.lanl.gov/data_pub/rbspa/

2. 算法说明
进入需要下载的数据所在的目录,获取并解析该目录下的信息,解析出cdf文件名后,将cdf文件下载到内存中,随后保存到硬盘中。程序使用python3实现。

3. 程序代码

#!/bin/python3
# get the rbsp data
# writen by Liangjin Song on 20191219
import sys
import requests
from pathlib import Path

# the url containing the cdf files
url="https://www.rbsp-ect.lanl.gov/data_pub/rbspa/ECT/level2/2016/"
# local path to save the cdf file
path="/home/liangjin/Downloads/test/"

def main():
  re=requests.get(url)
  html=re.text
  cdfs=resolve_cdf(html)

  ncdf=len(cdfs)
  if ncdf == 0:
    return

  print(str(ncdf) + " cdf files are detected.")

  i=1
  # download 
  for f in cdfs:
    rcdf=url+f
    lcdf=path+f
    print(str(i)+ "  Downloading " + rcdf)
    download_cdf(rcdf,lcdf)
    i+=1
  return

# resolve the file name of cdf
def resolve_cdf(html):
  cdfs=list()
  head=html.find("href=")
  
  if head == -1:
    print("The cdf files not found!")
    return cdfs

  leng=len(html)

  while head != -1:
    tail=html.find(">",head,leng)
    # Extract the cdf file name
    cdf=html[head+6:tail-1]
    head=html.find("href=",tail,leng)
    if cdf.find('cdf') == -1:
      continue
    cdfs.append(cdf)
  return cdfs

def download_cdf(rcdf,lcdf):
  rfile=requests.get(rcdf)
  with open(lcdf,"wb") as f:
    f.write(rfile.content)
  f.close()
  return

if __name__ == "__main__":
  lpath=Path(path)
  if not lpath.is_dir():
    print("Path not found: " + path)
    sys.exit(0)
  sys.exit(main())

4. 使用说明

url为远程cdf文件所在路径。
path为本地保存cdf文件的路径。
url和path的末尾都有“/”(Linux下情形,若是Windows,路径分隔符为“\\”,则path末尾应为“\\”)。

5. 运行效果

使用python3批量下载rbsp数据的示例代码

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
一则python3的简单爬虫代码
May 26 Python
零基础写python爬虫之爬虫框架Scrapy安装配置
Nov 06 Python
详解python的几种标准输出重定向方式
Aug 15 Python
Python基于递归实现电话号码映射功能示例
Apr 13 Python
使用Python抓取豆瓣影评数据的方法
Oct 17 Python
python 处理微信对账单数据的实例代码
Jul 19 Python
在pycharm中显示python画的图方法
Aug 31 Python
Django Docker容器化部署之Django-Docker本地部署
Oct 09 Python
使用Python函数进行模块化的实现
Nov 15 Python
python3实现从kafka获取数据,并解析为json格式,写入到mysql中
Dec 23 Python
从多个tfrecord文件中无限读取文件的例子
Feb 17 Python
python实现简单井字棋游戏
Mar 04 Python
Python使用QQ邮箱发送邮件报错smtplib.SMTPAuthenticationError
Dec 20 #Python
Python字符串、列表、元组、字典、集合的补充实例详解
Dec 20 #Python
python获取网络图片方法及整理过程详解
Dec 20 #Python
python序列化与数据持久化实例详解
Dec 20 #Python
爬虫代理池Python3WebSpider源代码测试过程解析
Dec 20 #Python
python3的UnicodeDecodeError解决方法
Dec 20 #Python
基于python调用psutil模块过程解析
Dec 20 #Python
You might like
php的日期处理函数及uchome的function_coomon中日期处理函数的研究
2011/01/12 PHP
php的chr和ord函数实现字符加减乘除运算实现代码
2011/12/05 PHP
php 表单提交大量数据发生丢失的解决方法
2014/03/03 PHP
获取服务器传来的数据 用JS去空格的正则表达式
2012/03/26 Javascript
javascript中的startWith和endWith的几种实现方法
2013/05/07 Javascript
struts2+jquery组合验证注册用户是否存在
2014/04/30 Javascript
jQuery中extend函数详解
2015/02/13 Javascript
分享9点个人认为比较重要的javascript 编程技巧
2015/04/27 Javascript
JS延时提示框实现方法详解
2015/11/26 Javascript
基于JavaScript实现鼠标悬浮弹出跟随鼠标移动的带箭头的信息层
2016/01/18 Javascript
深入浅析JavaScript面向对象和原型函数
2016/02/06 Javascript
js实现人民币大写金额形式转换
2016/04/27 Javascript
探究JavaScript中的五种事件处理程序方式
2016/12/07 Javascript
layui分页效果实现代码
2017/05/19 Javascript
vue单页开发父子组件传值思路详解
2018/05/18 Javascript
微信小程序进入广告实现代码实例
2019/09/19 Javascript
highcharts.js数据绑定方式代码实例
2019/11/13 Javascript
Python+Pika+RabbitMQ环境部署及实现工作队列的实例教程
2016/06/29 Python
Python编程中对super函数的正确理解和用法解析
2016/07/02 Python
浅析Python中yield关键词的作用与用法
2016/11/29 Python
python中用logging实现日志滚动和过期日志删除功能
2019/08/20 Python
python接口自动化如何封装获取常量的类
2019/12/24 Python
Python While循环语句实例演示及原理解析
2020/01/03 Python
详解PyQt5信号与槽的几种高级玩法
2020/03/24 Python
Python 实现 T00ls 自动签到脚本代码(邮件+钉钉通知)
2020/07/06 Python
CSS3 二级导航菜单的制作的示例
2018/04/02 HTML / CSS
phonegap常用事件总结(必看篇)
2017/03/31 HTML / CSS
伦敦最著名的老字号百货公司:Selfridges(塞尔福里奇百货)
2016/07/25 全球购物
法学函授自我鉴定
2014/02/06 职场文书
电大毕业个人生自我鉴定
2014/03/26 职场文书
绿色学校实施方案
2014/03/31 职场文书
小学评语大全
2014/04/22 职场文书
签约仪式策划方案
2014/06/02 职场文书
五好家庭申报材料
2014/12/20 职场文书
小学中等生评语
2014/12/29 职场文书
颐和园英文导游词
2015/01/30 职场文书