使用Python爬取最好大学网大学排名


Posted in Python onFebruary 24, 2018

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码,供大家参考,具体内容如下

源代码:

#-*-coding:utf-8-*- 
''''' 
Created on 2017年3月17日 
@author: lavi 
''' 
import requests 
from bs4 import BeautifulSoup 
import bs4 
def getHTMLText(url): 
  try: 
    r = requests.get(url) 
    r.raise_for_status 
    r.encoding = r.apparent_encoding 
    return r.text 
  except: 
    return "" 
 
def fillUnivList(univList,html): 
  soup = BeautifulSoup(html,"html.parser") 
  for tr in soup.find("tbody").children: 
    if isinstance(tr,bs4.element.Tag): #tobody有的节点是空串,属于要判断类型进行过滤 
      tds = tr("td") #等价于tr.find_all("td") 
      univList.append([tds[0].string,tds[1].string,tds[2].string]) #NavigableString可以跨越多个层次 
 
def printUnivList(univList,num): 
  tplt = "{0:^6}\t{1:^10}\t{2:^6}" #:前的数字说明使用format函数的第几个参数填充模板 
  print(tplt.format("排名","学校名称","总分",chr(12288))) 
  for i in range(num): 
    u = univList[i] 
    print(tplt.format(u[0],u[1],u[2],chr(12288))) 
def main(): 
  url= "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"; 
  html = getHTMLText(url) 
  univList=[] 
  fillUnivList(univList,html) 
  printUnivList(univList,20) 
   
main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python二叉树的实现实例
Nov 21 Python
Python多线程编程(三):threading.Thread类的重要函数和方法
Apr 05 Python
numpy.delete删除一列或多列的方法
Apr 03 Python
NumPy 数学函数及代数运算的实现代码
Jul 18 Python
详解python中Numpy的属性与创建矩阵
Sep 10 Python
python实现简易动态时钟
Nov 19 Python
python利用百度AI实现文字识别功能
Nov 27 Python
Django中使用Whoosh进行全文检索的方法
Mar 31 Python
django drf框架自带的路由及最简化的视图
Sep 10 Python
python找出列表中大于某个阈值的数据段示例
Nov 24 Python
在django中自定义字段Field详解
Dec 03 Python
如何利用Python给自己的头像加一个小国旗(小月饼)
Oct 02 Python
python opencv 直方图反向投影的方法
Feb 24 #Python
python爬虫爬取淘宝商品信息
Feb 23 #Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
You might like
用PHP动态创建Flash动画
2006/10/09 PHP
关于BIG5-HKSCS的解决方法
2007/03/20 PHP
使用PHP的日期与时间函数技巧
2008/04/24 PHP
PHP form 表单传参明细研究
2009/07/17 PHP
微信扫描二维码登录网站代码示例
2013/12/30 PHP
PHP+jQuery实现双击修改table表格功能示例
2019/02/21 PHP
JSON 客户端和服务器端的格式转换
2009/08/27 Javascript
js去除重复字符串两种实现方法
2013/01/09 Javascript
jquery.autocomplete修改实现键盘上下键自动填充示例
2013/11/19 Javascript
中文输入法不触发onkeyup事件的解决办法
2014/07/09 Javascript
jQuery实现长按按钮触发事件的方法
2015/02/02 Javascript
js实现键盘Enter键提交表单的方法
2015/05/27 Javascript
JavaScript变量的作用域全解析
2015/08/14 Javascript
JS+CSS实现的经典圆角下拉菜单效果代码
2015/10/21 Javascript
jQuery遮罩层实现方法实例详解(附遮罩层插件)
2015/12/08 Javascript
利用Javascript仿Excel的数据透视分析功能
2016/09/07 Javascript
javascript ASCII和Hex互转的实现方法
2016/12/27 Javascript
详解在vue-cli项目下简单使用mockjs模拟数据
2018/10/19 Javascript
Vue开发Html5微信公众号的步骤
2019/04/11 Javascript
python解决字典中的值是列表问题的方法
2013/03/04 Python
Python基于numpy灵活定义神经网络结构的方法
2017/08/19 Python
numpy使用技巧之数组过滤实例代码
2018/02/03 Python
TensorFlow平台下Python实现神经网络
2018/03/10 Python
Python中如何导入类示例详解
2019/04/17 Python
Python参数传递对象的引用原理解析
2020/05/22 Python
解决Pytorch自定义层出现多Variable共享内存错误问题
2020/06/28 Python
HTML5自定义属性前缀data-及dataset的使用方法(html5 新特性)
2017/08/24 HTML / CSS
Pretty Little Thing爱尔兰:时尚女性服饰
2017/03/27 全球购物
Smallable英国家庭概念店:设计师童装及家居装饰
2017/07/05 全球购物
高一数学教学反思
2014/02/07 职场文书
厂长岗位职责
2014/02/19 职场文书
房屋租赁协议书范本
2014/04/10 职场文书
2014党支部对照检查材料思想汇报
2014/10/05 职场文书
2014年终个人工作总结
2014/11/07 职场文书
2015年秋季灭鼠工作总结
2015/07/27 职场文书
PyMongo 查询数据的实现
2021/06/28 Python