python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python ZipFile模块详解
Nov 01 Python
Python中的异常处理学习笔记
Jan 28 Python
在Django的模板中使用认证数据的方法
Jul 23 Python
Python数据类型详解(三)元祖:tuple
May 08 Python
Python字符串和字典相关操作的实例详解
Sep 23 Python
python实现二维插值的三维显示
Dec 17 Python
正确理解Python中if __name__ == '__main__'
Jan 24 Python
python 实现将多条曲线画在一幅图上的方法
Jul 07 Python
django中forms组件的使用与注意
Jul 08 Python
详解Python 循环嵌套
Jul 09 Python
python实现将中文日期转换为数字日期
Jul 14 Python
解决TensorFlow训练模型及保存数量限制的问题
Mar 03 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
php中数字0和空值的区别分析
2014/06/05 PHP
PHP封装的字符串加密解密函数
2015/12/18 PHP
php is_executable判断给定文件名是否可执行实例
2016/09/26 PHP
PHP对象、模式与实践之高级特性分析
2016/12/08 PHP
Javascript字符串对象的常用方法简明版
2014/06/26 Javascript
jquery实现翻动fadeIn显示的方法
2015/03/05 Javascript
JS组件Form表单验证神器BootstrapValidator
2016/01/26 Javascript
避免jQuery名字冲突 noConflict()方法
2016/07/30 Javascript
AngularJS基础 ng-copy 指令实例代码
2016/08/01 Javascript
Vuejs第七篇之Vuejs过渡动画案例全面解析
2016/09/05 Javascript
基于Vue如何封装分页组件
2016/12/16 Javascript
微信小程序 this和that详解及简单实例
2017/02/13 Javascript
关于jQuery里prev()的简单操作代码
2017/10/27 jQuery
angular json对象push到数组中的方法
2018/02/27 Javascript
详解JS函数stack size计算方法
2018/06/18 Javascript
[43:03]LGD vs Newbee 2019国际邀请赛小组赛 BO2 第一场 8.16
2019/08/19 DOTA
Python简单计算文件夹大小的方法
2015/07/14 Python
linux查找当前python解释器的位置方法
2019/02/20 Python
Python使用字典的嵌套功能详解
2019/02/27 Python
python使用requests.session模拟登录
2019/08/09 Python
Python中的 sort 和 sorted的用法与区别
2019/08/10 Python
python操作openpyxl导出Excel 设置单元格格式及合并处理代码实例
2019/08/27 Python
使用Django搭建一个基金模拟交易系统教程
2019/11/18 Python
python实现canny边缘检测
2020/09/14 Python
Python3利用scapy局域网实现自动多线程arp扫描功能
2021/01/21 Python
Auchan Direct波兰:欧尚在线杂货店
2016/10/19 全球购物
荷兰鞋子在线:Nelson Schoenen
2017/12/25 全球购物
安德玛菲律宾官网:Under Armour菲律宾
2020/07/28 全球购物
什么是会话Bean
2015/05/14 面试题
群众路线教育实践活动整改落实情况汇报
2014/10/28 职场文书
工作能力自我评价2015
2015/03/05 职场文书
国家助学贷款承诺书
2015/04/30 职场文书
2016年最美孝心少年事迹材料
2016/02/26 职场文书
2016年小学教师师德承诺书
2016/03/25 职场文书
浅谈@Value和@Bean的执行顺序问题
2021/06/16 Java/Android
Mysql超详细讲解死锁问题的理解
2022/04/01 MySQL