python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python 正则式使用心得
May 07 Python
python使用在线API查询IP对应的地理位置信息实例
Jun 01 Python
python查找目录下指定扩展名的文件实例
Apr 01 Python
Python中用Spark模块的使用教程
Apr 13 Python
Python判断直线和矩形是否相交的方法
Jul 14 Python
深入讲解Java编程中类的生命周期
Feb 05 Python
tensorflow实现简单逻辑回归
Sep 07 Python
python垃圾回收机制(GC)原理解析
Dec 30 Python
Keras自动下载的数据集/模型存放位置介绍
Jun 19 Python
Python HTMLTestRunner如何下载生成报告
Sep 04 Python
python爬取”顶点小说网“《纯阳剑尊》的示例代码
Oct 16 Python
Python Flask搭建yolov3目标检测系统详解流程
Nov 07 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
Zerg建筑一览
2020/03/14 星际争霸
一个改进的UBB类
2006/10/09 PHP
用PHP与XML联手进行网站编程代码实例
2008/07/10 PHP
php适配器模式简单应用示例
2019/10/23 PHP
jQuery 1.0.2
2006/10/11 Javascript
Javascript 异步加载详解(浏览器在javascript的加载方式)
2012/05/20 Javascript
Javascript变量作用域详解
2013/12/06 Javascript
avalon js实现仿微博拖动图片排序
2015/08/14 Javascript
asp.net+jquery.form实现图片异步上传的方法(附jquery.form.js下载)
2016/05/05 Javascript
jQuery实现拖拽页面元素并将其保存到cookie的方法
2016/06/12 Javascript
jquery单击文字或图片内容放大并居中显示
2017/06/23 jQuery
Vue自定义事件(详解)
2017/08/19 Javascript
Vuex入门到上手教程
2018/06/20 Javascript
解决bootstrap模态框数据缓存的问题方法
2018/08/10 Javascript
基于JavaScript实现每日签到打卡轨迹功能
2018/11/29 Javascript
Vue使用zTree插件封装树组件操作示例
2019/04/25 Javascript
vue实现图片上传功能
2020/05/28 Javascript
[02:36]DOTA2英雄基础教程 一击致命幻影刺客
2013/12/06 DOTA
python合并文本文件示例
2014/02/07 Python
python发布模块的步骤分享
2014/02/21 Python
探寻python多线程ctrl+c退出问题解决方案
2014/10/23 Python
简单介绍Python下自己编写web框架的一些要点
2015/04/29 Python
浅析Python的Django框架中的Memcached
2015/07/23 Python
Django进阶之CSRF的解决
2018/08/01 Python
使用TensorFlow实现简单线性回归模型
2019/07/19 Python
python爬虫 urllib模块反爬虫机制UA详解
2019/08/20 Python
Python之Django自动实现html代码(下拉框,数据选择)
2020/03/13 Python
python实现数学模型(插值、拟合和微分方程)
2020/11/13 Python
捷克厨房用品购物网站:Tescoma
2018/07/13 全球购物
财务会计实习报告体会
2013/12/20 职场文书
小小商店教学反思
2014/04/27 职场文书
优秀少先队员事迹材料
2014/12/24 职场文书
质检员岗位职责
2015/02/03 职场文书
2015年乡镇纪检工作总结
2015/04/22 职场文书
2015年远程教育工作总结
2015/05/20 职场文书
导游词之四川熊猫基地
2020/01/13 职场文书