使用Python爬取最好大学网大学排名


Posted in Python onFebruary 24, 2018

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码,供大家参考,具体内容如下

源代码:

#-*-coding:utf-8-*- 
''''' 
Created on 2017年3月17日 
@author: lavi 
''' 
import requests 
from bs4 import BeautifulSoup 
import bs4 
def getHTMLText(url): 
  try: 
    r = requests.get(url) 
    r.raise_for_status 
    r.encoding = r.apparent_encoding 
    return r.text 
  except: 
    return "" 
 
def fillUnivList(univList,html): 
  soup = BeautifulSoup(html,"html.parser") 
  for tr in soup.find("tbody").children: 
    if isinstance(tr,bs4.element.Tag): #tobody有的节点是空串,属于要判断类型进行过滤 
      tds = tr("td") #等价于tr.find_all("td") 
      univList.append([tds[0].string,tds[1].string,tds[2].string]) #NavigableString可以跨越多个层次 
 
def printUnivList(univList,num): 
  tplt = "{0:^6}\t{1:^10}\t{2:^6}" #:前的数字说明使用format函数的第几个参数填充模板 
  print(tplt.format("排名","学校名称","总分",chr(12288))) 
  for i in range(num): 
    u = univList[i] 
    print(tplt.format(u[0],u[1],u[2],chr(12288))) 
def main(): 
  url= "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"; 
  html = getHTMLText(url) 
  univList=[] 
  fillUnivList(univList,html) 
  printUnivList(univList,20) 
   
main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
web.py中调用文件夹内模板的方法
Aug 26 Python
Python中使用md5sum检查目录中相同文件代码分享
Feb 02 Python
pymongo实现多结果进行多列排序的方法
May 16 Python
Python使用pylab库实现画线功能的方法详解
Jun 08 Python
对python中执行DOS命令的3种方法总结
May 12 Python
python中datetime模块中strftime/strptime函数的使用
Jul 03 Python
python检测IP地址变化并触发事件
Dec 26 Python
python实现剪切功能
Jan 23 Python
pytorch使用指定GPU训练的实例
Aug 19 Python
Python读写操作csv和excle文件代码实例
Mar 16 Python
详解Python Celery和RabbitMQ实战教程
Jan 20 Python
python 列表推导和生成器表达式的使用
Feb 01 Python
python opencv 直方图反向投影的方法
Feb 24 #Python
python爬虫爬取淘宝商品信息
Feb 23 #Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
You might like
PHP is_dir() 判断给定文件名是否是一个目录
2010/05/10 PHP
php实现姓名根据首字母排序的类与方法(实例代码)
2018/05/16 PHP
laravel-admin自动生成模块,及相关基础配置方法
2019/10/08 PHP
Mootools 1.2教程 滚动条(Slider)
2009/09/15 Javascript
关于jquery性能最佳实践的讨论,与求教
2012/03/30 Javascript
SeaJS 与 RequireJS 的差异对比
2014/12/08 Javascript
JavaScript 面向对象与原型
2015/04/10 Javascript
使用bootstrap validator的remote验证代码经验分享(推荐)
2016/09/21 Javascript
JS去除字符串中空格的方法
2017/02/14 Javascript
JavaScript之DOM插入更新删除_动力节点Java学院整理
2017/07/03 Javascript
ES6 迭代器(Iterator)和 for.of循环使用方法学习(总结)
2018/02/08 Javascript
angular6 利用 ngContentOutlet 实现组件位置交换(重排)
2018/11/02 Javascript
angular4自定义表单控件[(ngModel)]的实现
2018/11/23 Javascript
React 使用recharts实现散点地图的示例代码
2018/12/07 Javascript
JS遍历JSON数组及获取JSON数组长度操作示例【测试可用】
2018/12/12 Javascript
微信小程序实现下拉框功能
2019/07/16 Javascript
JQuery基于FormData异步提交数据文件
2020/09/01 jQuery
[04:56]经典回顾:前Ehome 与 前LGD
2015/02/26 DOTA
python 判断一个进程是否存在
2009/04/09 Python
python搜索指定目录的方法
2015/04/29 Python
关于Django外键赋值问题详解
2017/08/13 Python
放弃 Python 转向 Go语言有人给出了 9 大理由
2017/10/20 Python
Flask框架实现给视图函数增加装饰器操作示例
2018/07/16 Python
python批量下载网站马拉松照片的完整步骤
2018/12/05 Python
用Python实现二叉树、二叉树非递归遍历及绘制的例子
2019/08/09 Python
django 使用 PIL 压缩图片的例子
2019/08/16 Python
一文了解python 3 字符串格式化 F-string 用法
2020/03/04 Python
如何用JQuery进行表单验证
2013/05/29 面试题
煤矿机修工岗位职责
2014/02/07 职场文书
眼镜促销方案
2014/03/15 职场文书
公司晚会主持词
2014/03/22 职场文书
大学生撤销处分思想汇报
2014/09/12 职场文书
售房协议书范本2014
2014/10/23 职场文书
公务员保密工作承诺书
2015/05/04 职场文书
催款律师函范文
2015/05/27 职场文书
高一作文之暖冬
2019/11/09 职场文书