python获取整个网页源码的方法


Posted in Python onAugust 03, 2020

1、Python中获取整个页面的代码:

import requests
res = requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding = 'utf-8'
print(res.text)

2、运行结果

python获取整个网页源码的方法

实例扩展:

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,
   print links,
   print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

到此这篇关于python获取整个网页源码的方法的文章就介绍到这了,更多相关python如何获取整个页面内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python远程登录代码
Apr 29 Python
python和pyqt实现360的CLable控件
Feb 21 Python
Python写的PHPMyAdmin暴力破解工具代码
Aug 06 Python
基于Python的文件类型和字符串详解
Dec 21 Python
wxPython的安装图文教程(Windows)
Dec 28 Python
python Gunicorn服务器使用方法详解
Jul 22 Python
python实现的按要求生成手机号功能示例
Oct 08 Python
python实现高斯投影正反算方式
Jan 17 Python
利用4行Python代码监测每一行程序的运行时间和空间消耗
Apr 22 Python
Python基础进阶之海量表情包多线程爬虫功能的实现
Dec 17 Python
python爬虫之selenium库的安装及使用教程
May 23 Python
详解如何用Python实现感知器算法
Jun 18 Python
flask开启多线程的具体方法
Aug 02 #Python
基于opencv实现简单画板功能
Aug 02 #Python
django下创建多个app并设置urls方法
Aug 02 #Python
Django如何在不停机的情况下创建索引
Aug 02 #Python
如何用Anaconda搭建虚拟环境并创建Django项目
Aug 02 #Python
如何解决flask修改静态资源后缓存文件不能及时更改问题
Aug 02 #Python
Flask缓存静态文件的具体方法
Aug 02 #Python
You might like
Laravel中的Blade模板引擎示例详解
2017/10/10 PHP
彻底搞懂PHP 变量结构体
2017/10/11 PHP
javascript不同类型数据之间的运算的转换方法
2014/02/13 Javascript
jQuery使用andSelf()来包含之前的选择集
2014/05/19 Javascript
jQuery修改CSS伪元素属性的方法
2014/07/30 Javascript
兼容最新firefox、chrome和IE的javascript图片预览实现代码
2014/08/08 Javascript
jquery插件jquery.LightBox.js实现点击放大图片并左右点击切换效果(附demo源码下载)
2016/02/25 Javascript
javascript中对Date类型的常用操作小结
2016/05/19 Javascript
JS输出空格的简单实现方法
2016/09/08 Javascript
微信小程序 页面跳转如何实现传值
2017/04/05 Javascript
jQuery实现简单的抽奖游戏
2017/05/05 jQuery
微信小程序点击控件修改样式实例详解
2017/07/07 Javascript
Bootstrap框架建立树形菜单(Tree)的实例代码
2017/10/30 Javascript
js构造函数创建对象是否加new问题
2018/01/22 Javascript
jQuery 实现倒计时天,时,分,秒功能
2018/07/31 jQuery
新手必须知的Node.js 4个JavaScript基本概念
2018/09/16 Javascript
node.js中 redis 的安装和基本操作示例
2020/02/10 Javascript
Node.js设置定时任务之node-schedule模块的使用详解
2020/04/28 Javascript
在Django的视图中使用数据库查询的方法
2015/07/16 Python
Python中 Lambda表达式全面解析
2016/11/28 Python
Python 使用 docopt 解析json参数文件过程讲解
2019/08/13 Python
python爬虫 线程池创建并获取文件代码实例
2019/09/28 Python
使用tqdm显示Python代码执行进度功能
2019/12/08 Python
Python GUI编程学习笔记之tkinter控件的介绍及基本使用方法详解
2020/03/30 Python
Python 在局部变量域中执行代码
2020/08/07 Python
Python 实现一个简单的web服务器
2021/01/03 Python
html5 http的轮询和Websocket原理
2018/10/19 HTML / CSS
印度化妆品购物网站:Nykaa
2018/07/22 全球购物
Orvis官网:自1856年以来,优质服装、飞钓装备等
2018/12/17 全球购物
可持续木材、生态和铝制太阳镜:Proof Eyewear
2019/07/24 全球购物
CSMA/CD介质访问控制协议
2015/11/17 面试题
税务干部鉴定材料
2014/02/11 职场文书
个人贷款担保书
2014/04/01 职场文书
人大调研汇报材料
2014/08/14 职场文书
党员干部学习十八届五中全会精神心得体会
2016/01/05 职场文书
css布局巧妙技巧之css三角示例的运用
2022/03/16 HTML / CSS