使用Python爬取最好大学网大学排名


Posted in Python onFebruary 24, 2018

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码,供大家参考,具体内容如下

源代码:

#-*-coding:utf-8-*- 
''''' 
Created on 2017年3月17日 
@author: lavi 
''' 
import requests 
from bs4 import BeautifulSoup 
import bs4 
def getHTMLText(url): 
  try: 
    r = requests.get(url) 
    r.raise_for_status 
    r.encoding = r.apparent_encoding 
    return r.text 
  except: 
    return "" 
 
def fillUnivList(univList,html): 
  soup = BeautifulSoup(html,"html.parser") 
  for tr in soup.find("tbody").children: 
    if isinstance(tr,bs4.element.Tag): #tobody有的节点是空串,属于要判断类型进行过滤 
      tds = tr("td") #等价于tr.find_all("td") 
      univList.append([tds[0].string,tds[1].string,tds[2].string]) #NavigableString可以跨越多个层次 
 
def printUnivList(univList,num): 
  tplt = "{0:^6}\t{1:^10}\t{2:^6}" #:前的数字说明使用format函数的第几个参数填充模板 
  print(tplt.format("排名","学校名称","总分",chr(12288))) 
  for i in range(num): 
    u = univList[i] 
    print(tplt.format(u[0],u[1],u[2],chr(12288))) 
def main(): 
  url= "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"; 
  html = getHTMLText(url) 
  univList=[] 
  fillUnivList(univList,html) 
  printUnivList(univList,20) 
   
main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在漏洞利用Python代码真的很爽
Aug 26 Python
python中的全局变量用法分析
Jun 09 Python
Python深入06——python的内存管理详解
Dec 07 Python
Python实现简单的语音识别系统
Dec 13 Python
在Pycharm中执行scrapy命令的方法
Jan 16 Python
python Qt5实现窗体跟踪鼠标移动
Dec 13 Python
使用python3批量下载rbsp数据的示例代码
Dec 20 Python
tensorflow之获取tensor的shape作为max_pool的ksize实例
Jan 04 Python
ansible动态Inventory主机清单配置遇到的坑
Jan 19 Python
Python基于模块Paramiko实现SSHv2协议
Apr 28 Python
python正则表达式的懒惰匹配和贪婪匹配说明
Jul 13 Python
python+appium+yaml移动端自动化测试框架实现详解
Nov 24 Python
python opencv 直方图反向投影的方法
Feb 24 #Python
python爬虫爬取淘宝商品信息
Feb 23 #Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
You might like
php5编程中的异常处理详细方法介绍
2008/07/29 PHP
php中批量删除Mysql中相同前缀的数据表的代码
2011/07/01 PHP
通过缓存数据库结果提高PHP性能的原理介绍
2012/09/05 PHP
用Simple Excel导出xls实现方法
2012/12/06 PHP
一个经典实用的PHP图像处理类分享
2014/11/18 PHP
AJAX PHP无刷新form表单提交的简单实现(推荐)
2016/09/09 PHP
DEDE实现转跳属性文档在模板上调用出转跳地址
2016/11/04 PHP
PHP实现webshell扫描文件木马的方法
2017/07/31 PHP
Laravel学习教程之model validation的使用示例
2017/10/23 PHP
PHP 记录访客的浏览信息方法
2018/01/29 PHP
[原创]静态页面也可以实现预览 列表不同的显示方式
2006/10/14 Javascript
getElementById在任意一款浏览器中都可以用吗的疑问回复
2007/05/13 Javascript
jQuery获取Radio,CheckBox选择的Value值(示例代码)
2013/12/12 Javascript
基于JavaScript实现全屏透明遮罩div层锁屏效果
2016/01/26 Javascript
VUE长按事件需求详解
2017/10/18 Javascript
让axios发送表单请求形式的键值对post数据的实例
2018/08/11 Javascript
前后端如何实现登录token拦截校验详解
2018/09/03 Javascript
浅谈VueJS SSR 后端绘制内存泄漏的相关解决经验
2018/12/20 Javascript
实例分析编写vue组件方法
2019/02/12 Javascript
基于JS实现简单滑块拼图游戏
2019/10/12 Javascript
vuex actions异步修改状态的实例详解
2019/11/06 Javascript
vue2.x 对象劫持的原理实现
2020/04/19 Javascript
ant-design-vue按需加载的坑的解决
2020/05/14 Javascript
解决vue-pdf查看pdf文件及打印乱码的问题
2020/11/04 Javascript
vue 解决mintui弹窗弹起来,底部页面滚动bug问题
2020/11/12 Javascript
node中短信api实现验证码登录的示例代码
2021/01/20 Javascript
python开发之str.format()用法实例分析
2016/02/22 Python
python中的文件打开与关闭操作命令介绍
2018/04/26 Python
Python3.5基础之函数的定义与使用实例详解【参数、作用域、递归、重载等】
2019/04/26 Python
Python二维码生成识别实例详解
2019/07/16 Python
科颜氏英国官网:Kiehl’s英国
2019/11/20 全球购物
汽车专业毕业生推荐信
2013/11/12 职场文书
日本语毕业生自荐信
2014/02/01 职场文书
店长职务说明书
2014/02/04 职场文书
Redis 中使用 list,streams,pub/sub 几种方式实现消息队列的问题
2022/03/16 Redis
Mysql排查分析慢sql之explain实战案例
2022/04/19 MySQL