使用Python爬取最好大学网大学排名


Posted in Python onFebruary 24, 2018

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码,供大家参考,具体内容如下

源代码:

#-*-coding:utf-8-*- 
''''' 
Created on 2017年3月17日 
@author: lavi 
''' 
import requests 
from bs4 import BeautifulSoup 
import bs4 
def getHTMLText(url): 
  try: 
    r = requests.get(url) 
    r.raise_for_status 
    r.encoding = r.apparent_encoding 
    return r.text 
  except: 
    return "" 
 
def fillUnivList(univList,html): 
  soup = BeautifulSoup(html,"html.parser") 
  for tr in soup.find("tbody").children: 
    if isinstance(tr,bs4.element.Tag): #tobody有的节点是空串,属于要判断类型进行过滤 
      tds = tr("td") #等价于tr.find_all("td") 
      univList.append([tds[0].string,tds[1].string,tds[2].string]) #NavigableString可以跨越多个层次 
 
def printUnivList(univList,num): 
  tplt = "{0:^6}\t{1:^10}\t{2:^6}" #:前的数字说明使用format函数的第几个参数填充模板 
  print(tplt.format("排名","学校名称","总分",chr(12288))) 
  for i in range(num): 
    u = univList[i] 
    print(tplt.format(u[0],u[1],u[2],chr(12288))) 
def main(): 
  url= "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"; 
  html = getHTMLText(url) 
  univList=[] 
  fillUnivList(univList,html) 
  printUnivList(univList,20) 
   
main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python进行稳定可靠的文件操作详解
Dec 31 Python
Python3实现并发检验代理池地址的方法
Sep 18 Python
Python简单操作sqlite3的方法示例
Mar 22 Python
Python实现字符串匹配算法代码示例
Dec 05 Python
python pandas 组内排序、单组排序、标号的实例
Apr 12 Python
python skimage 连通性区域检测方法
Jun 21 Python
记录Python脚本的运行日志的方法
Jun 05 Python
Pycharm保存不能自动同步到远程服务器的解决方法
Jun 27 Python
解决Djang2.0.1中的reverse导入失败的问题
Aug 16 Python
python 比较2张图片的相似度的方法示例
Dec 18 Python
Python实现Kerberos用户的增删改查操作
Dec 14 Python
termux中matplotlib无法显示中文问题的解决方法
Jan 11 Python
python opencv 直方图反向投影的方法
Feb 24 #Python
python爬虫爬取淘宝商品信息
Feb 23 #Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
You might like
DOTA2 6.87版本后新眼位详解攻略
2020/04/20 DOTA
php 遍历数据表数据并列表横向排列的代码
2009/09/05 PHP
PHP命名空间(Namespace)的使用详解
2013/05/04 PHP
详解WordPress中调用评论模板和循环输出评论的PHP函数
2016/01/05 PHP
JavaScript 创建对象和构造类实现代码
2009/07/30 Javascript
jquery(hide方法)隐藏指定元素实例
2013/11/11 Javascript
调试JavaScript中正则表达式中遇到的问题
2015/01/27 Javascript
jQuery中slideUp 和 slideDown 的点击事件
2015/02/26 Javascript
在JavaScript中操作数组之map()方法的使用
2015/06/09 Javascript
javascript阻止事件冒泡和浏览器的默认行为
2017/01/21 Javascript
详解Chai.js断言库API中文文档
2018/01/31 Javascript
微信小程序进入广告实现代码实例
2019/09/19 Javascript
vuex + keep-alive实现tab标签页面缓存功能
2019/10/17 Javascript
JS写滑稽笑脸运动效果
2020/05/28 Javascript
vue中template的三种写法示例
2020/10/21 Javascript
[48:53]2014 DOTA2华西杯精英邀请赛 5 25 LGD VS VG第一场
2014/05/26 DOTA
[53:43]VP vs NewBee Supermajor 胜者组 BO3 第三场 6.5
2018/06/06 DOTA
Python使用Flask框架获取当前查询参数的方法
2015/03/21 Python
Python引用类型和值类型的区别与使用解析
2017/10/17 Python
Python字符串拼接六种方法介绍
2017/12/18 Python
tensorflow 输出权重到csv或txt的实例
2018/06/14 Python
详解Python Matplot中文显示完美解决方案
2019/03/07 Python
Python3 JSON编码解码方法详解
2019/09/06 Python
详解numpy矩阵的创建与数据类型
2019/10/18 Python
flask框架配置mysql数据库操作详解
2019/11/29 Python
python多线程和多进程关系详解
2020/12/14 Python
支持IE8的纯css3开发的响应式设计动画菜单教程
2014/11/05 HTML / CSS
localStorage 设置过期时间的方法实现
2018/12/21 HTML / CSS
HTML中使用SVG与SVG预定义形状元素介绍
2013/06/28 HTML / CSS
俄罗斯在线购买飞机票、火车票、巴士票网站:Tutu.ru
2020/03/16 全球购物
UDP协议功能
2013/01/06 面试题
运动会加油稿50字
2015/07/21 职场文书
浅谈redis五大数据结构和使用场景
2021/04/12 Redis
Oracle中update和select 关联操作
2022/01/18 Oracle
python数字类型和占位符详情
2022/03/13 Python
vue生命周期钩子函数以及触发时机
2022/04/26 Vue.js