使用python3批量下载rbsp数据的示例代码


Posted in Python onDecember 20, 2019

1. 原始网站
https://www.rbsp-ect.lanl.gov/data_pub/rbspa/

2. 算法说明
进入需要下载的数据所在的目录,获取并解析该目录下的信息,解析出cdf文件名后,将cdf文件下载到内存中,随后保存到硬盘中。程序使用python3实现。

3. 程序代码

#!/bin/python3
# get the rbsp data
# writen by Liangjin Song on 20191219
import sys
import requests
from pathlib import Path

# the url containing the cdf files
url="https://www.rbsp-ect.lanl.gov/data_pub/rbspa/ECT/level2/2016/"
# local path to save the cdf file
path="/home/liangjin/Downloads/test/"

def main():
  re=requests.get(url)
  html=re.text
  cdfs=resolve_cdf(html)

  ncdf=len(cdfs)
  if ncdf == 0:
    return

  print(str(ncdf) + " cdf files are detected.")

  i=1
  # download 
  for f in cdfs:
    rcdf=url+f
    lcdf=path+f
    print(str(i)+ "  Downloading " + rcdf)
    download_cdf(rcdf,lcdf)
    i+=1
  return

# resolve the file name of cdf
def resolve_cdf(html):
  cdfs=list()
  head=html.find("href=")
  
  if head == -1:
    print("The cdf files not found!")
    return cdfs

  leng=len(html)

  while head != -1:
    tail=html.find(">",head,leng)
    # Extract the cdf file name
    cdf=html[head+6:tail-1]
    head=html.find("href=",tail,leng)
    if cdf.find('cdf') == -1:
      continue
    cdfs.append(cdf)
  return cdfs

def download_cdf(rcdf,lcdf):
  rfile=requests.get(rcdf)
  with open(lcdf,"wb") as f:
    f.write(rfile.content)
  f.close()
  return

if __name__ == "__main__":
  lpath=Path(path)
  if not lpath.is_dir():
    print("Path not found: " + path)
    sys.exit(0)
  sys.exit(main())

4. 使用说明

url为远程cdf文件所在路径。
path为本地保存cdf文件的路径。
url和path的末尾都有“/”(Linux下情形,若是Windows,路径分隔符为“\\”,则path末尾应为“\\”)。

5. 运行效果

使用python3批量下载rbsp数据的示例代码

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python strip()函数 介绍
May 24 Python
从零学python系列之新版本导入httplib模块报ImportError解决方案
May 23 Python
python中的sort方法使用详解
Jul 25 Python
Django分页查询并返回jsons数据(中文乱码解决方法)
Aug 02 Python
解决Pycharm下面出现No R interpreter defined的问题
Oct 29 Python
使用Python进行目录的对比方法
Nov 01 Python
python读取几个G的csv文件方法
Jan 07 Python
Python 实现数据结构-循环队列的操作方法
Jul 17 Python
python统计指定目录内文件的代码行数
Sep 19 Python
用openCV和Python 实现图片对比,并标识出不同点的方式
Dec 19 Python
python3的pip路径在哪
Jun 23 Python
Python批量解压&压缩文件夹的示例代码
Apr 04 Python
Python使用QQ邮箱发送邮件报错smtplib.SMTPAuthenticationError
Dec 20 #Python
Python字符串、列表、元组、字典、集合的补充实例详解
Dec 20 #Python
python获取网络图片方法及整理过程详解
Dec 20 #Python
python序列化与数据持久化实例详解
Dec 20 #Python
爬虫代理池Python3WebSpider源代码测试过程解析
Dec 20 #Python
python3的UnicodeDecodeError解决方法
Dec 20 #Python
基于python调用psutil模块过程解析
Dec 20 #Python
You might like
php 动态添加记录
2009/03/10 PHP
PHP 日志缩略名的创建函数代码
2010/05/26 PHP
php像数组一样存取和修改字符串字符
2014/03/21 PHP
php实现根据url自动生成缩略图的方法
2014/09/23 PHP
PHP实现的简单三角形、矩形周长面积计算器分享
2014/11/18 PHP
PHP的Trait机制原理与用法分析
2019/10/18 PHP
PHP连接MySQL数据库三种实现方法
2020/12/10 PHP
js 字符串操作函数
2009/07/25 Javascript
超轻量级的基于jquery的三级展开列表
2011/04/26 Javascript
jQuery+ajax实现动态执行脚本的方法
2015/01/27 Javascript
jQuery选择器源码解读(四):tokenize方法的Expr.preFilter
2015/03/31 Javascript
AngularJS实用开发技巧(推荐)
2016/07/13 Javascript
微信小程序 picker-view 组件详解及简单实例
2017/01/10 Javascript
微信小程序开发之数据存储 参数传递 数据缓存
2017/04/13 Javascript
JavaScript实现图片拖曳效果
2017/09/08 Javascript
angularjs实现猜数字大小功能
2020/05/20 Javascript
Javascript节流函数throttle和防抖函数debounce
2020/12/03 Javascript
微信小程序实现登录注册功能
2020/12/29 Javascript
Python中的模块和包概念介绍
2015/04/13 Python
python删除列表中重复记录的方法
2015/04/28 Python
Linux下通过python访问MySQL、Oracle、SQL Server数据库的方法
2016/04/23 Python
Python OpenCV实现图片上输出中文
2018/01/22 Python
python实现浪漫的烟花秀
2019/01/30 Python
Pandas分组与排序的实现
2019/07/23 Python
python写入数据到csv或xlsx文件的3种方法
2019/08/23 Python
假日旅行社实习自我鉴定
2013/09/24 职场文书
自我鉴定四大框架
2014/01/17 职场文书
设计师求职信模板
2014/05/06 职场文书
2014国庆节餐厅促销活动策划方案
2014/09/16 职场文书
项目合作协议书
2014/09/23 职场文书
幼儿园小班见习报告
2014/10/31 职场文书
布达拉宫的导游词
2015/02/02 职场文书
物业保洁员管理制度
2015/08/05 职场文书
小学二年级语文教学反思
2016/03/03 职场文书
Jupyter Notebook 如何修改字体和大小以及更改字体样式
2021/06/03 Python
pt-archiver 主键自增
2022/04/26 MySQL