使用Python爬取最好大学网大学排名


Posted in Python onFebruary 24, 2018

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码,供大家参考,具体内容如下

源代码:

#-*-coding:utf-8-*- 
''''' 
Created on 2017年3月17日 
@author: lavi 
''' 
import requests 
from bs4 import BeautifulSoup 
import bs4 
def getHTMLText(url): 
  try: 
    r = requests.get(url) 
    r.raise_for_status 
    r.encoding = r.apparent_encoding 
    return r.text 
  except: 
    return "" 
 
def fillUnivList(univList,html): 
  soup = BeautifulSoup(html,"html.parser") 
  for tr in soup.find("tbody").children: 
    if isinstance(tr,bs4.element.Tag): #tobody有的节点是空串,属于要判断类型进行过滤 
      tds = tr("td") #等价于tr.find_all("td") 
      univList.append([tds[0].string,tds[1].string,tds[2].string]) #NavigableString可以跨越多个层次 
 
def printUnivList(univList,num): 
  tplt = "{0:^6}\t{1:^10}\t{2:^6}" #:前的数字说明使用format函数的第几个参数填充模板 
  print(tplt.format("排名","学校名称","总分",chr(12288))) 
  for i in range(num): 
    u = univList[i] 
    print(tplt.format(u[0],u[1],u[2],chr(12288))) 
def main(): 
  url= "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"; 
  html = getHTMLText(url) 
  univList=[] 
  fillUnivList(univList,html) 
  printUnivList(univList,20) 
   
main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用xauth方式登录饭否网然后发消息
Apr 11 Python
基于Python实现的ID3决策树功能示例
Jan 02 Python
详解用python实现简单的遗传算法
Jan 02 Python
解决Python print输出不换行没空格的问题
Nov 14 Python
PythonWeb项目Django部署在Ubuntu18.04腾讯云主机上
Apr 01 Python
python实现Excel文件转换为TXT文件
Apr 28 Python
深入了解Django View(视图系统)
Jul 23 Python
python打造爬虫代理池过程解析
Aug 15 Python
使用Python实现分别输出每个数组
Dec 06 Python
Python3自定义http/https请求拦截mitmproxy脚本实例
May 11 Python
Keras 利用sklearn的ROC-AUC建立评价函数详解
Jun 15 Python
python如何删除列为空的行
Jul 17 Python
python opencv 直方图反向投影的方法
Feb 24 #Python
python爬虫爬取淘宝商品信息
Feb 23 #Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
You might like
使用php+xslt在windows平台上
2006/10/09 PHP
PHP EOT定界符的使用详解
2008/09/30 PHP
解析csv数据导入mysql的方法
2013/07/01 PHP
php获取参数的几种方法总结
2014/02/18 PHP
PHP JSON出错:Cannot use object of type stdClass as array解决方法
2014/08/16 PHP
Laravel5.1自定义500错误页面示例
2016/10/09 PHP
dreamweaver 安装Jquery智能提示
2011/04/02 Javascript
解析prototype,JQuery中跳出each循环的方法
2013/12/12 Javascript
javascript创建数组之联合数组的使用方法示例
2013/12/26 Javascript
js加减乘除丢失精度问题解决方法
2014/05/16 Javascript
jQuery学习笔记之jQuery.fn.init()的参数分析
2014/06/09 Javascript
jQuery中:button选择器用法实例
2015/01/04 Javascript
jquery实现的淡入淡出下拉菜单效果
2015/08/25 Javascript
EXT中单击button按钮grid添加一行(光标位置可设置)的实例代码
2016/06/02 Javascript
JavaScript数据结构之数组的表示方法示例
2017/04/12 Javascript
微信小程序之获取当前位置经纬度以及地图显示详解
2017/05/09 Javascript
使用Nodejs连接mongodb数据库的实现代码
2017/08/21 NodeJs
百度小程序自定义通用toast组件
2019/07/17 Javascript
vue打包通过image-webpack-loader插件对图片压缩优化操作
2020/11/12 Javascript
python读取excel表格生成erlang数据
2017/08/26 Python
Python高级用法总结
2018/05/26 Python
python 实现在一张图中绘制一个小的子图方法
2019/07/07 Python
python中p-value的实现方式
2019/12/16 Python
Python GUI编程学习笔记之tkinter事件绑定操作详解
2020/03/30 Python
python 星号(*)的多种用途
2020/09/21 Python
纯CSS绘制漂亮的圆形图案效果
2014/05/07 HTML / CSS
html5 canvas-1.canvas介绍(hello canvas)
2013/01/07 HTML / CSS
在线课程:Skillshare
2019/04/02 全球购物
附答案的Java面试题
2012/11/19 面试题
What's the difference between an interface and abstract class? (接口与抽象类有什么区别)
2012/10/29 面试题
儿科护士实习自我鉴定
2013/10/17 职场文书
高中生毕业自我鉴定范文
2013/12/22 职场文书
寄语学生的话
2014/04/10 职场文书
会计求职信范文
2014/05/24 职场文书
汽车服务工程专业自荐信
2014/09/02 职场文书
Python re.sub 反向引用的实现
2021/07/07 Python