python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python Tkinter简单布局实例教程
Sep 03 Python
Python转换HTML到Text纯文本的方法
Jan 15 Python
用Python实现协同过滤的教程
Apr 08 Python
Python中文竖排显示的方法
Jul 28 Python
python爬取网页转换为PDF文件
Jun 07 Python
python获取微信企业号打卡数据并生成windows计划任务
Apr 30 Python
pandas数据筛选和csv操作的实现方法
Jul 02 Python
python 叠加等边三角形的绘制的实现
Aug 14 Python
基于python代码批量处理图片resize
Jun 04 Python
python中id函数运行方式
Jul 03 Python
基于python图书馆管理系统设计实例详解
Aug 05 Python
一小时学会TensorFlow2之基本操作2实例代码
Sep 04 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
php 无限级分类,超级简单的无限级分类,支持输出树状图
2014/06/29 PHP
微信公众平台开发-微信服务器IP接口实例(含源码)
2017/03/05 PHP
PHP随机获取未被微信屏蔽的域名(微信域名检测)
2017/03/19 PHP
基于php流程控制语句和循环控制语句(讲解)
2017/10/23 PHP
PDO::exec讲解
2019/01/28 PHP
PHP simplexml_load_string()函数实例讲解
2019/02/03 PHP
js获取客户端外网ip的简单实例
2013/11/21 Javascript
ECMAScript 6即将带给我们新的数组操作方法前瞻
2015/01/06 Javascript
深入理解JavaScript系列(37):设计模式之享元模式详解
2015/03/04 Javascript
分享9个最好用的JavaScript开发工具和代码编辑器
2015/03/24 Javascript
javascript中DOM复选框选择用法实例
2015/05/14 Javascript
Angularjs中的ui-bootstrap的使用教程
2017/02/19 Javascript
Vue 2.x教程之基础API
2017/03/06 Javascript
ThinkPHP+jquery实现“加载更多”功能代码
2017/03/11 Javascript
js数组实现权重概率分配
2017/09/12 Javascript
vue使用高德地图点击下钻上浮效果的实现思路
2019/10/12 Javascript
微信小程序页面间传递数组对象方法解析
2019/11/06 Javascript
js实现拖动缓动效果
2020/01/13 Javascript
Jquery ajax书写方法代码实例解析
2020/06/12 jQuery
js+canvas绘制图形验证码
2020/09/21 Javascript
[01:18:43]2014 DOTA2华西杯精英邀请赛5 24 iG VS DK
2014/05/25 DOTA
Python 实现简单的电话本功能
2015/08/09 Python
python实现接口并发测试脚本
2019/06/25 Python
Python 旋转打印各种矩形的方法
2019/07/09 Python
python tqdm 实现滚动条不上下滚动代码(保持一行内滚动)
2020/02/19 Python
python使用openpyxl操作excel的方法步骤
2020/05/28 Python
python实现图片转换成素描和漫画格式
2020/08/19 Python
印度尼西亚在线时尚购物网站:ZALORA印尼
2016/08/02 全球购物
介绍一下linux文件系统分配策略
2012/11/17 面试题
纪念九一八事变演讲稿1000字
2014/09/14 职场文书
2015婚礼主持词开场白
2015/05/28 职场文书
家长意见和建议怎么写
2015/06/04 职场文书
Html分层的box-shadow效果的示例代码
2021/03/30 HTML / CSS
深度学习tensorflow基础mnist
2021/04/14 Python
vue3使用vuedraggable实现拖拽功能
2022/04/06 Vue.js
ECharts transform数据转换和dataZoom在项目中使用
2022/12/24 Javascript