使用Python爬取最好大学网大学排名


Posted in Python onFebruary 24, 2018

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码,供大家参考,具体内容如下

源代码:

#-*-coding:utf-8-*- 
''''' 
Created on 2017年3月17日 
@author: lavi 
''' 
import requests 
from bs4 import BeautifulSoup 
import bs4 
def getHTMLText(url): 
  try: 
    r = requests.get(url) 
    r.raise_for_status 
    r.encoding = r.apparent_encoding 
    return r.text 
  except: 
    return "" 
 
def fillUnivList(univList,html): 
  soup = BeautifulSoup(html,"html.parser") 
  for tr in soup.find("tbody").children: 
    if isinstance(tr,bs4.element.Tag): #tobody有的节点是空串,属于要判断类型进行过滤 
      tds = tr("td") #等价于tr.find_all("td") 
      univList.append([tds[0].string,tds[1].string,tds[2].string]) #NavigableString可以跨越多个层次 
 
def printUnivList(univList,num): 
  tplt = "{0:^6}\t{1:^10}\t{2:^6}" #:前的数字说明使用format函数的第几个参数填充模板 
  print(tplt.format("排名","学校名称","总分",chr(12288))) 
  for i in range(num): 
    u = univList[i] 
    print(tplt.format(u[0],u[1],u[2],chr(12288))) 
def main(): 
  url= "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"; 
  html = getHTMLText(url) 
  univList=[] 
  fillUnivList(univList,html) 
  printUnivList(univList,20) 
   
main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
分享python数据统计的一些小技巧
Jul 21 Python
利用python实现数据分析
Jan 11 Python
Python如何通过subprocess调用adb命令详解
Aug 27 Python
Python读取Word(.docx)正文信息的方法
Mar 15 Python
pandas对指定列进行填充的方法
Apr 11 Python
python实现跨excel的工作表sheet之间的复制方法
May 03 Python
Django基础知识与基本应用入门教程
Jul 20 Python
Python增强赋值和共享引用注意事项小结
May 28 Python
python+numpy实现的基本矩阵操作示例
Jul 19 Python
python isinstance函数用法详解
Feb 13 Python
学会python自动收发邮件 代替你问候女友
May 20 Python
浅谈keras中loss与val_loss的关系
Jun 22 Python
python opencv 直方图反向投影的方法
Feb 24 #Python
python爬虫爬取淘宝商品信息
Feb 23 #Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
You might like
PHP6 mysql连接方式说明
2009/02/09 PHP
php下保存远程图片到本地的办法
2010/08/08 PHP
php使用qr生成二维码的示例分享
2014/01/20 PHP
thinkPHP框架对接支付宝即时到账接口回调操作示例
2016/11/14 PHP
Zend Framework分发器用法示例
2016/12/11 PHP
通过DOM脚本去设置样式信息
2010/09/19 Javascript
TextArea不支持maxlength的解决办法(jquery)
2011/09/13 Javascript
Prototype的Class.create函数解析
2011/09/22 Javascript
jquery 插件学习(六)
2012/08/06 Javascript
jquery制作搜狐快站页面效果示例分享
2014/02/21 Javascript
ajax读取数据后使用jqchart显示图表的方法
2015/06/10 Javascript
canvas实现十二星座星空图
2017/02/14 Javascript
js数组方法reduce经典用法代码分享
2018/01/07 Javascript
JavaScript实现Tab选项卡切换
2020/02/13 Javascript
javascript贪吃蛇游戏设计与实现
2020/09/17 Javascript
JS实现简易日历效果
2021/01/25 Javascript
[41:11]完美世界DOTA2联赛PWL S2 Inki vs Magma 第一场 11.22
2020/11/24 DOTA
python基于pygame实现响应游戏中事件的方法(附源码)
2015/11/11 Python
python实现定时发送qq消息
2019/01/18 Python
初探利用Python进行图文识别(OCR)
2019/02/26 Python
使用Python paramiko模块利用多线程实现ssh并发执行操作
2019/12/05 Python
Python嵌套函数,作用域与偏函数用法实例分析
2019/12/26 Python
在python3中实现更新界面
2020/02/21 Python
python的Jenkins接口调用方式
2020/05/12 Python
Python日志处理模块logging用法解析
2020/05/19 Python
cookies应对python反爬虫知识点详解
2020/11/25 Python
C语言如何决定使用那种整数类型
2016/11/26 面试题
初中生期末考试的自我评价
2013/12/17 职场文书
初中英语课后反思
2014/04/25 职场文书
乡镇干部先进性教育活动个人整改措施
2014/09/16 职场文书
2014年企业团支部工作总结
2014/12/10 职场文书
校友会致辞
2015/07/30 职场文书
小学大队长竞选稿
2015/11/20 职场文书
2016年5月份红领巾广播稿
2015/12/21 职场文书
Axios取消重复请求的方法实例详解
2021/06/15 Javascript
Win11怎么添加用户?Win11添加用户账户的方法
2022/07/15 数码科技