python获取整个网页源码的方法


Posted in Python onAugust 03, 2020

1、Python中获取整个页面的代码:

import requests
res = requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding = 'utf-8'
print(res.text)

2、运行结果

python获取整个网页源码的方法

实例扩展:

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,
   print links,
   print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

到此这篇关于python获取整个网页源码的方法的文章就介绍到这了,更多相关python如何获取整个页面内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现汉诺塔递归算法经典案例
Mar 01 Python
Python守护进程和脚本单例运行详解
Jan 06 Python
python中matplotlib实现最小二乘法拟合的过程详解
Jul 11 Python
Python爬虫设置代理IP(图文)
Dec 23 Python
详解python中的数据类型和控制流
Aug 08 Python
python生成器用法实例详解
Nov 22 Python
pygame库实现移动底座弹球小游戏
Apr 14 Python
Python with语句和过程抽取思想
Dec 23 Python
Python终端输出彩色字符方法详解
Feb 11 Python
python时间与Unix时间戳相互转换方法详解
Feb 13 Python
Python 批量读取文件中指定字符的实现
Mar 06 Python
深度学习tensorflow基础mnist
Apr 14 Python
flask开启多线程的具体方法
Aug 02 #Python
基于opencv实现简单画板功能
Aug 02 #Python
django下创建多个app并设置urls方法
Aug 02 #Python
Django如何在不停机的情况下创建索引
Aug 02 #Python
如何用Anaconda搭建虚拟环境并创建Django项目
Aug 02 #Python
如何解决flask修改静态资源后缓存文件不能及时更改问题
Aug 02 #Python
Flask缓存静态文件的具体方法
Aug 02 #Python
You might like
Laravel如何实现适合Api的异常处理响应格式
2020/06/14 PHP
JavaScript 密码强度判断代码
2009/09/05 Javascript
jQuery的三种$()
2009/12/30 Javascript
IE6/7 and IE8/9/10(IE7模式)依次隐藏具有absolute或relative的父元素和子元素后再显示父元素
2011/07/31 Javascript
7款风格新颖的jQuery/CSS3菜单导航分享
2013/04/23 Javascript
JavaScript中的slice()方法使用详解
2015/06/06 Javascript
jquery实现点击其他区域时隐藏下拉div和遮罩层的方法
2015/12/23 Javascript
javascript实现图片轮播效果
2016/01/20 Javascript
js实现不重复导入的方法
2016/03/02 Javascript
iframe中使用jquery进行查找的方法【案例分析】
2016/06/17 Javascript
微信小程序 slider 详解及实例代码
2017/01/10 Javascript
nodejs 子进程正确的打开方式
2017/07/03 NodeJs
js编写简单的聊天室功能
2017/08/17 Javascript
vuex的简单使用教程
2018/02/02 Javascript
vue.js删除列表中的一行
2018/06/30 Javascript
JavaScript中使用Spread运算符的八种方法总结
2020/06/18 Javascript
使用React-Router实现前端路由鉴权的示例代码
2020/07/26 Javascript
js在HTML的三种引用方式详解
2020/08/29 Javascript
[02:43]DOTA2英雄基础教程 圣堂刺客
2013/12/09 DOTA
[44:40]KG vs LGD 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/16 DOTA
浅谈python中的面向对象和类的基本语法
2016/06/13 Python
python中os模块详解
2016/10/14 Python
python 对多个csv文件分别进行处理的方法
2019/01/07 Python
对python字典过滤条件的实例详解
2019/01/22 Python
Python3+Pycharm+PyQt5环境搭建步骤图文详解
2019/05/29 Python
python中读入二维csv格式的表格方法详解(以元组/列表形式表示)
2020/04/24 Python
tensorflow之读取jpg图像长和宽实例
2020/06/18 Python
美国购买汽车零件网站:Buy Auto Parts
2018/04/02 全球购物
电钳专业个人求职信
2014/01/04 职场文书
会议活动邀请函
2014/01/27 职场文书
青年文明号申报材料
2014/12/23 职场文书
员工自我评价范文
2015/03/11 职场文书
laravel ajax curd 搜索登录判断功能的实现
2021/04/17 PHP
python数据库批量插入数据的实现(executemany的使用)
2021/04/30 Python
Mysql8.0递归查询的简单用法示例
2021/08/04 MySQL
Echarts如何重新渲染实例详解
2022/05/30 Javascript