Python爬取数据保存为Json格式的代码示例


Posted in Python onApril 09, 2019

python爬取数据保存为Json格式

代码如下:

#encoding:'utf-8'
import urllib.request
from bs4 import BeautifulSoup
import os
import time
import codecs
import json
#找到网址
def getDatas():
  # 伪装
  header={'User-Agent':"Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11"}
  # url="https://movie.douban.com/top250"
  url="file:///E:/scrapy/2018-04-27/movie/movie.html"
  ret=urllib.request.Request(url=url,headers=header)
  # 打开网页
  res=urllib.request.urlopen(ret)
  # 转化格式
  response=BeautifulSoup(res,'html.parser')
  # 找到想要数据的父元素
  datas=response.find_all('div',{'class':'item'})
  # print(datas)
  #创建存放数据的文件夹
  folder_name="output"
  if not os.path.exists(folder_name):
      os.mkdir(folder_name)
  # 定义文件
  current_time=time.strftime('%Y-%m-%d',time.localtime())
  file_name="move"+current_time+".json"
  # 文件路径
  file_path=folder_name+"/"+file_name
  for item in datas:
    # print(item)
    dict1={}
    dict1['rank']=item.find('div',{'class':'pic'}).find('em').get_text()
    dict1['title']=item.find('div',{'class':'info'}).find('div',{'class':'hd'}).find('a').find('span',{'class':'title'}).get_text()
    dict1['picUrl']=item.find('div',{'class':'pic'}).find('a').find('img').get('src')
    # print(picUrl)
    # 保存数据为json格式
    try:
      with codecs.open(file_path,'a',encoding="utf-8") as fp:
        fp.write(json.dumps(dict1,ensure_ascii=False)+",\n")
    except IOError as err:
      print('error'+str(err))
    finally:
      fp.close()
  pass
getDatas()
# 爬取数据

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python基础入门之seed()方法的使用
May 15 Python
Python实现压缩和解压缩ZIP文件的方法分析
Sep 28 Python
用python与文件进行交互的方法
Mar 01 Python
python pandas读取csv后,获取列标签的方法
Nov 12 Python
Python面向对象程序设计类的多态用法详解
Apr 12 Python
Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)
Jun 28 Python
使用TensorFlow实现简单线性回归模型
Jul 19 Python
python从list列表中选出一个数和其对应的坐标方法
Jul 20 Python
基于Pyinstaller打包Python程序并压缩文件大小
May 28 Python
Python暴力破解Mysql数据的示例
Nov 09 Python
Python和Bash结合在一起的方法
Nov 13 Python
Python之qq自动发消息的示例代码
Feb 18 Python
python实现QQ空间自动点赞功能
Apr 09 #Python
Python实现的多进程拷贝文件并显示百分比功能示例
Apr 09 #Python
Python使用crontab模块设置和清除定时任务操作详解
Apr 09 #Python
Python实现的读取文件内容并写入其他文件操作示例
Apr 09 #Python
Python实现根据日期获取当天凌晨时间戳的方法示例
Apr 09 #Python
Python匿名函数及应用示例
Apr 09 #Python
用Python中的turtle模块画图两只小羊方法
Apr 09 #Python
You might like
PHP中文分词的简单实现代码分享
2011/07/17 PHP
php修改NetBeans默认字体的大小
2013/07/02 PHP
Display SQL Server Version Information
2007/06/21 Javascript
符合W3C网页标准的iframe标签的使用方法
2007/07/19 Javascript
JS调试必备的5个debug技巧
2014/03/07 Javascript
node.js中的path.resolve方法使用说明
2014/12/08 Javascript
Javascript闭包用法实例分析
2015/01/23 Javascript
Javascript无参数和有参数类继承问题解决方法
2015/03/02 Javascript
jQuery插件制作之参数用法实例分析
2015/06/01 Javascript
jQuery插件Timelinr 实现时间轴特效
2015/10/04 Javascript
前端jquery部分很精彩
2016/05/03 Javascript
JavaScript 计算笛卡尔积实例详解
2016/12/02 Javascript
9种改善AngularJS性能的方法
2017/11/28 Javascript
AngularJS日期格式化常见操作实例分析
2018/05/17 Javascript
JavaScript实现点击出现图片并统计点击次数功能示例
2018/07/23 Javascript
JavaScript函数式编程(Functional Programming)高阶函数(Higher order functions)用法分析
2019/05/22 Javascript
Node.js Domain 模块实例详解
2020/03/18 Javascript
python里使用正则的findall函数的实例详解
2017/10/19 Python
将Django项目部署到CentOs服务器中
2018/10/18 Python
python实现指定字符串补全空格、前面填充0的方法
2018/11/16 Python
用python3 返回鼠标位置的实现方法(带界面)
2019/07/05 Python
Python使用type关键字创建类步骤详解
2019/07/23 Python
Python命令行参数解析工具 docopt 安装和应用过程详解
2019/09/26 Python
DJANGO-URL反向解析REVERSE实例讲解
2019/10/25 Python
SmartBuyGlasses英国:购买太阳镜和眼镜
2018/01/29 全球购物
芬兰灯具网上商店:Nettilamppu.fi
2018/06/30 全球购物
股份合作协议书
2014/04/12 职场文书
高中生国庆节演讲稿范文2014
2014/09/21 职场文书
社区领导班子四风问题原因分析及整改措施
2014/09/28 职场文书
寒假社会实践个人总结
2015/03/06 职场文书
员工工作表扬信
2015/05/05 职场文书
2019毕业论文致谢词
2019/06/24 职场文书
关于Oracle12C默认用户名system密码不正确的解决方案
2021/10/16 Oracle
vue+iview实现手机号分段输入框
2022/03/25 Vue.js
Python中使用Opencv开发停车位计数器功能
2022/04/04 Python
JS前端使用canvas实现物体的点选示例
2022/08/05 Javascript