python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python监控进程脚本
Apr 12 Python
Python实现识别图片内容的方法分析
Jul 11 Python
Python实现基于PIL和tesseract的验证码识别功能示例
Jul 11 Python
面向初学者的Python编辑器Mu
Oct 08 Python
python中嵌套函数的实操步骤
Feb 27 Python
Python脚本利用adb进行手机控制的方法
Jul 08 Python
pytorch中的卷积和池化计算方式详解
Jan 03 Python
Python标准库itertools的使用方法
Jan 17 Python
浅谈python累加求和+奇偶数求和_break_continue
Feb 25 Python
python 函数嵌套及多函数共同运行知识点讲解
Mar 03 Python
python爬虫开发之Request模块从安装到详细使用方法与实例全解
Mar 09 Python
Anaconda和ipython环境适配的实现
Apr 22 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
用Zend Encode编写开发PHP程序
2006/10/09 PHP
PHP isset()与empty()的使用区别详解
2010/08/29 PHP
php中比较简单的导入phpmyadmin生成的sql文件的方法
2011/06/28 PHP
win2003服务器使用WPS的COM组件的一些问题解决方法
2012/01/11 PHP
php实现多张图片上传加水印技巧
2013/04/18 PHP
PHP中mysqli_affected_rows作用行数返回值分析
2014/12/26 PHP
PHP实现在线阅读PDF文件的方法
2015/06/23 PHP
PHP微信开发之微信录音临时转永久存储
2018/01/26 PHP
广告代码静态化js通用函数
2007/05/09 Javascript
Jquery多选下拉列表插件jquery multiselect功能介绍及使用
2013/05/24 Javascript
JavaScript实现的encode64加密算法实例分析
2015/04/15 Javascript
JavaScript AOP编程实例
2015/06/16 Javascript
浅谈JavaScript异常处理语句
2015/06/26 Javascript
GitHub上一些实用的JavaScript的文件压缩解压缩库推荐
2016/03/13 Javascript
基于javascript html5实现3D翻书特效
2016/03/14 Javascript
node.js平台下的mysql数据库配置及连接
2017/03/31 Javascript
微信小程序中form 表单提交和取值实例详解
2017/04/20 Javascript
基于JS脚本语言的基础语法详解
2017/07/22 Javascript
vue+element 模态框表格形式的可编辑表单实现
2019/06/07 Javascript
[50:24]VGJ.S vs Pain 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/20 DOTA
python之import机制详解
2014/07/03 Python
python高手之路python处理excel文件(方法汇总)
2016/01/07 Python
非递归的输出1-N的全排列实例(推荐)
2017/04/11 Python
python不换行之end=与逗号的意思及用途
2017/11/21 Python
详解Python中的测试工具
2019/06/09 Python
Python查找不限层级Json数据中某个key或者value的路径方式
2020/02/27 Python
python数据分析工具之 matplotlib详解
2020/04/09 Python
Python bisect模块原理及常见实例
2020/06/17 Python
如何让PyQt5中QWebEngineView与JavaScript交互
2020/10/21 Python
美国猫狗药物和用品网站:PetCareRx
2017/01/05 全球购物
船舶工程技术专业求职信
2014/08/07 职场文书
解除劳动关系协议书范文
2014/09/11 职场文书
2015年教师党员承诺书
2015/04/27 职场文书
体育教师教学随笔
2015/08/15 职场文书
2019年图书室自查报告范本
2019/10/12 职场文书
浅谈CSS不规则边框的生成方案
2021/05/25 HTML / CSS