使用Python爬取最好大学网大学排名


Posted in Python onFebruary 24, 2018

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码,供大家参考,具体内容如下

源代码:

#-*-coding:utf-8-*- 
''''' 
Created on 2017年3月17日 
@author: lavi 
''' 
import requests 
from bs4 import BeautifulSoup 
import bs4 
def getHTMLText(url): 
  try: 
    r = requests.get(url) 
    r.raise_for_status 
    r.encoding = r.apparent_encoding 
    return r.text 
  except: 
    return "" 
 
def fillUnivList(univList,html): 
  soup = BeautifulSoup(html,"html.parser") 
  for tr in soup.find("tbody").children: 
    if isinstance(tr,bs4.element.Tag): #tobody有的节点是空串,属于要判断类型进行过滤 
      tds = tr("td") #等价于tr.find_all("td") 
      univList.append([tds[0].string,tds[1].string,tds[2].string]) #NavigableString可以跨越多个层次 
 
def printUnivList(univList,num): 
  tplt = "{0:^6}\t{1:^10}\t{2:^6}" #:前的数字说明使用format函数的第几个参数填充模板 
  print(tplt.format("排名","学校名称","总分",chr(12288))) 
  for i in range(num): 
    u = univList[i] 
    print(tplt.format(u[0],u[1],u[2],chr(12288))) 
def main(): 
  url= "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"; 
  html = getHTMLText(url) 
  univList=[] 
  fillUnivList(univList,html) 
  printUnivList(univList,20) 
   
main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的exec、eval使用实例
Sep 23 Python
Python警察与小偷的实现之一客户端与服务端通信实例
Oct 09 Python
Python函数式编程指南(二):从函数开始
Jun 24 Python
十个Python程序员易犯的错误
Dec 15 Python
基于python的Tkinter实现一个简易计算器
Dec 31 Python
Python模块WSGI使用详解
Feb 02 Python
Python3利用Dlib19.7实现摄像头人脸识别的方法
May 11 Python
Python中最大递归深度值的探讨
Mar 05 Python
python发qq消息轰炸虐狗好友思路详解(完整代码)
Feb 15 Python
Python开发企业微信机器人每天定时发消息实例
Mar 17 Python
python 使用多线程创建一个Buffer缓存器的实现思路
Jul 02 Python
利于python脚本编写可视化nmap和masscan的方法
Dec 29 Python
python opencv 直方图反向投影的方法
Feb 24 #Python
python爬虫爬取淘宝商品信息
Feb 23 #Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
You might like
Terran剧情介绍
2020/03/14 星际争霸
在laravel-admin中列表中禁止某行编辑、删除的方法
2019/10/03 PHP
PHP架构及原理知识点详解
2019/12/22 PHP
yii2.0框架场景的简单使用示例
2020/01/25 PHP
php post换行的方法
2020/02/03 PHP
YII2框架中behavior行为的理解与使用方法示例
2020/03/13 PHP
js解析xml字符串和xml文档实现原理及代码(针对ie与火狐)
2013/02/02 Javascript
javascript内存管理详细解析
2013/11/11 Javascript
JavaScript控制图片加载完成后调用回调函数的方法
2015/03/20 Javascript
javascript实现PC网页里的拖拽效果
2016/03/14 Javascript
全面解析Bootstrap中form、navbar的使用方法
2016/05/30 Javascript
学习Angular中作用域需要注意的坑
2016/08/17 Javascript
JavaScript表单验证开发
2016/11/23 Javascript
JS实现颜色动态淡化效果
2017/03/06 Javascript
jQuery实现分页功能(含ajax请求、后台数据、附完整demo)
2017/04/03 jQuery
使用node.js搭建服务器
2017/05/20 Javascript
基于BootStrap实现简洁注册界面
2017/07/20 Javascript
react-native之ART绘图方法详解
2017/08/08 Javascript
jQuery plugin animsition使用小结
2017/09/14 jQuery
Vue2.0 slot分发内容与props验证的方法
2017/12/12 Javascript
Bootstrap 时间日历插件bootstrap-datetimepicker配置与应用小结
2019/05/28 Javascript
JavaScript 面向对象基础简单示例
2019/10/02 Javascript
Python编写生成验证码的脚本的教程
2015/05/04 Python
Python编程实现使用线性回归预测数据
2017/12/07 Python
基于Python在MacOS上安装robotframework-ride
2018/12/28 Python
实例介绍Python中整型
2019/02/11 Python
python3 写一个WAV音频文件播放器的代码
2019/09/27 Python
Tensorflow 1.0之后模型文件、权重数值的读取方式
2020/02/12 Python
Django实现celery定时任务过程解析
2020/04/21 Python
PyCharm2019.3永久激活破解详细图文教程,亲测可用(不定期更新)
2020/10/29 Python
亚马逊海外购:亚马逊美国、英国、日本、德国直邮
2021/03/18 全球购物
自我鉴定200字
2013/10/28 职场文书
企业军训感言
2014/02/08 职场文书
《四季》教学反思
2014/04/08 职场文书
2014大四本科生自我鉴定总结
2014/10/04 职场文书
开学随笔
2015/08/15 职场文书