编程 Python

python获取整个网页源码的方法

Posted in Python onAugust 03, 2020

1、Python中获取整个页面的代码：

import requests
res = requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding = 'utf-8'
print(res.text)

2、运行结果

实例扩展：

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,
   print links,
   print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

到此这篇关于python获取整个网页源码的方法的文章就介绍到这了,更多相关python如何获取整个页面内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python获取整个网页源码的方法

- Author -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python实现汉诺塔递归算法经典案例

Mar 01 Python

Python守护进程和脚本单例运行详解

Jan 06 Python

python中matplotlib实现最小二乘法拟合的过程详解

Jul 11 Python

Python爬虫设置代理IP(图文)

Dec 23 Python

详解python中的数据类型和控制流

Aug 08 Python

python生成器用法实例详解

Nov 22 Python

pygame库实现移动底座弹球小游戏

Apr 14 Python

Python with语句和过程抽取思想

Dec 23 Python

Python终端输出彩色字符方法详解

Feb 11 Python

python时间与Unix时间戳相互转换方法详解

Feb 13 Python

Python 批量读取文件中指定字符的实现

Mar 06 Python

深度学习tensorflow基础mnist

Apr 14 Python

flask开启多线程的具体方法

Aug 02 #Python

基于opencv实现简单画板功能

Aug 02 #Python

django下创建多个app并设置urls方法

Aug 02 #Python

Django如何在不停机的情况下创建索引

Aug 02 #Python

如何用Anaconda搭建虚拟环境并创建Django项目

Aug 02 #Python

如何解决flask修改静态资源后缓存文件不能及时更改问题

Aug 02 #Python

Flask缓存静态文件的具体方法

Aug 02 #Python

You might like

Laravel如何实现适合Api的异常处理响应格式

2020/06/14 PHP

JavaScript 密码强度判断代码

2009/09/05 Javascript

jQuery的三种$()

2009/12/30 Javascript

IE6/7 and IE8/9/10(IE7模式)依次隐藏具有absolute或relative的父元素和子元素后再显示父元素

2011/07/31 Javascript

7款风格新颖的jQuery/CSS3菜单导航分享

2013/04/23 Javascript

JavaScript中的slice()方法使用详解

2015/06/06 Javascript

jquery实现点击其他区域时隐藏下拉div和遮罩层的方法

2015/12/23 Javascript

javascript实现图片轮播效果

2016/01/20 Javascript

js实现不重复导入的方法

2016/03/02 Javascript

iframe中使用jquery进行查找的方法【案例分析】

2016/06/17 Javascript

微信小程序 slider 详解及实例代码

2017/01/10 Javascript

nodejs 子进程正确的打开方式

2017/07/03 NodeJs

js编写简单的聊天室功能

2017/08/17 Javascript

vuex的简单使用教程

2018/02/02 Javascript

vue.js删除列表中的一行

2018/06/30 Javascript

JavaScript中使用Spread运算符的八种方法总结

2020/06/18 Javascript

使用React-Router实现前端路由鉴权的示例代码

2020/07/26 Javascript

js在HTML的三种引用方式详解

2020/08/29 Javascript

[02:43]DOTA2英雄基础教程圣堂刺客

2013/12/09 DOTA

[44:40]KG vs LGD 2019国际邀请赛小组赛 BO2 第一场 8.15

2019/08/16 DOTA

浅谈python中的面向对象和类的基本语法

2016/06/13 Python

python中os模块详解

2016/10/14 Python

python 对多个csv文件分别进行处理的方法

2019/01/07 Python

对python字典过滤条件的实例详解

2019/01/22 Python

Python3+Pycharm+PyQt5环境搭建步骤图文详解

2019/05/29 Python

python中读入二维csv格式的表格方法详解(以元组/列表形式表示)

2020/04/24 Python

tensorflow之读取jpg图像长和宽实例

2020/06/18 Python

美国购买汽车零件网站：Buy Auto Parts

2018/04/02 全球购物

电钳专业个人求职信

2014/01/04 职场文书

会议活动邀请函

2014/01/27 职场文书

青年文明号申报材料

2014/12/23 职场文书

员工自我评价范文

2015/03/11 职场文书

laravel ajax curd 搜索登录判断功能的实现

2021/04/17 PHP

python数据库批量插入数据的实现(executemany的使用)

2021/04/30 Python

Mysql8.0递归查询的简单用法示例

2021/08/04 MySQL

Echarts如何重新渲染实例详解

2022/05/30 Javascript