python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python+matplotlib实现动态绘制图片实例代码(交互式绘图)
Jan 20 Python
Python排序算法之选择排序定义与用法示例
Apr 29 Python
Python实用技巧之列表、字典、集合中根据条件筛选数据详解
Jul 11 Python
python查看模块安装位置的方法
Oct 16 Python
浅谈Python中的全局锁(GIL)问题
Jan 11 Python
python random从集合中随机选择元素的方法
Jan 23 Python
numpy 返回函数的上三角矩阵实例
Nov 25 Python
python-视频分帧&多帧合成视频实例
Dec 10 Python
python psutil监控进程实例
Dec 17 Python
Python request操作步骤及代码实例
Apr 13 Python
python实现定时发送邮件到指定邮箱
Dec 23 Python
Python学习之包与模块详解
Mar 19 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
PHP在字符串中查找指定字符串并删除的代码
2008/10/02 PHP
Smarty Foreach 使用说明
2010/03/23 PHP
PHP实现使用优酷土豆视频地址获取swf播放器分享地址
2014/06/05 PHP
php cookie名使用点号(句号)会被转换
2014/10/23 PHP
Javascript写入txt和读取txt文件示例
2014/02/12 Javascript
JavaScript表单通过正则表达式验证电话号码
2014/03/14 Javascript
jQuery绑定事件不执行但alert后可以正常执行
2014/06/03 Javascript
JS实现的仿QQ空间图片弹出效果代码
2016/02/23 Javascript
判断输入的字符串是否是日期格式的简单方法
2016/07/11 Javascript
javascript中数组和字符串的方法对比
2016/07/20 Javascript
React Native时间转换格式工具类分享
2017/10/24 Javascript
jQuery ajax读取本地json文件的实例
2017/10/31 jQuery
vue之父子组件间通信实例讲解(props、$ref、$emit)
2018/05/22 Javascript
详解Vue开发微信H5微信分享签名失败问题解决方案
2018/08/09 Javascript
vue2 拖动排序 vuedraggable组件的实现
2019/08/08 Javascript
Python标准库之多进程(multiprocessing包)介绍
2014/11/25 Python
python 2.6.6升级到python 2.7.x版本的方法
2016/10/09 Python
深入理解python中的select模块
2017/04/23 Python
Python探索之pLSA实现代码
2017/10/25 Python
Python工厂函数用法实例分析
2018/05/14 Python
Python unittest单元测试框架实现参数化
2020/04/29 Python
Python flask框架实现浏览器点击自定义跳转页面
2020/06/04 Python
keras实现调用自己训练的模型,并去掉全连接层
2020/06/09 Python
如何Tkinter模块编写Python图形界面
2020/10/14 Python
如何基于Python爬虫爬取美团酒店信息
2020/11/03 Python
python爬虫智能翻页批量下载文件的实例详解
2021/02/02 Python
ProBikeKit新西兰:自行车套件,跑步和铁人三项装备
2017/04/05 全球购物
美国战术品牌:5.11 Tactical
2019/05/01 全球购物
车工岗位职责
2013/11/26 职场文书
工作散漫检讨书
2014/09/16 职场文书
党的群众路线教育实践活动整改落实情况自查报告
2014/10/28 职场文书
毕业设计论文评语
2014/12/31 职场文书
幼儿园大班教师个人总结
2015/02/05 职场文书
2015暑期社会实践通讯稿
2015/07/18 职场文书
应届毕业生的自我评价
2019/06/21 职场文书
使用pd.merge表连接出现多余行的问题解决
2022/06/16 Python