python获取整个网页源码的方法


Posted in Python onAugust 03, 2020

1、Python中获取整个页面的代码:

import requests
res = requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding = 'utf-8'
print(res.text)

2、运行结果

python获取整个网页源码的方法

实例扩展:

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,
   print links,
   print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

到此这篇关于python获取整个网页源码的方法的文章就介绍到这了,更多相关python如何获取整个页面内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python3安装Pymongo详细步骤
May 26 Python
教你用Python写安卓游戏外挂
Jan 11 Python
将Dataframe数据转化为ndarry数据的方法
Jun 28 Python
Flask框架通过Flask_login实现用户登录功能示例
Jul 17 Python
解决pycharm无法识别本地site-packages的问题
Oct 13 Python
python 实现数字字符串左侧补零的方法
Dec 04 Python
python selenium登录豆瓣网过程解析
Aug 10 Python
python字符串的拼接方法总结
Nov 18 Python
Python测试线程应用程序过程解析
Dec 31 Python
Python 爬取必应壁纸的实例讲解
Feb 24 Python
Python如何使用27行代码绘制星星图
Jul 20 Python
python playwright 自动等待和断言详解
Nov 27 Python
flask开启多线程的具体方法
Aug 02 #Python
基于opencv实现简单画板功能
Aug 02 #Python
django下创建多个app并设置urls方法
Aug 02 #Python
Django如何在不停机的情况下创建索引
Aug 02 #Python
如何用Anaconda搭建虚拟环境并创建Django项目
Aug 02 #Python
如何解决flask修改静态资源后缓存文件不能及时更改问题
Aug 02 #Python
Flask缓存静态文件的具体方法
Aug 02 #Python
You might like
php adodb分页实现代码
2009/03/19 PHP
php木马webshell扫描器代码
2012/01/25 PHP
PHP整合PayPal支付
2015/06/11 PHP
PHPCrawl爬虫库实现抓取酷狗歌单的方法示例
2017/12/21 PHP
php合并数组并保留键值的实现方法
2018/03/12 PHP
php设计模式之装饰模式应用案例详解
2019/06/17 PHP
论坛特效代码收集(落伍转发-不错)
2006/12/02 Javascript
JQUERY获取form表单值的代码
2010/07/17 Javascript
基于Jquery的实现回车键Enter切换焦点
2010/09/14 Javascript
JS获取网页属性包括宽、高等等
2014/04/03 Javascript
JS排序方法(sort,bubble,select,insert)代码汇总
2016/01/30 Javascript
Bootstrap按钮组件详解
2016/04/26 Javascript
jQuery+CSS实现一个侧滑导航菜单代码
2016/05/09 Javascript
深入剖析JavaScript:Object类型
2016/05/10 Javascript
Bootstrap中datetimepicker使用小结
2016/12/28 Javascript
js正则表达式验证密码强度【推荐】
2017/03/03 Javascript
angular ng-model 无法获取值的处理方法
2018/10/02 Javascript
基于JS判断对象是否是数组
2020/01/10 Javascript
Python实现豆瓣图片下载的方法
2015/05/25 Python
全面解析Python的While循环语句的使用方法
2015/10/13 Python
Python编程实现的简单Web服务器示例
2017/06/22 Python
使用apidoc管理RESTful风格Flask项目接口文档方法
2018/02/07 Python
PyQt5 QSerialPort子线程操作的实现
2018/04/21 Python
python 获取一个值在某个区间的指定倍数的值方法
2018/11/12 Python
python统计文章中单词出现次数实例
2020/02/27 Python
将keras的h5模型转换为tensorflow的pb模型操作
2020/05/25 Python
Django Path转换器自定义及正则代码实例
2020/05/29 Python
使用Python将语音转换为文本的方法
2020/08/10 Python
Anaconda使用IDLE的实现示例
2020/09/23 Python
四年级下册教学反思
2014/02/01 职场文书
秋季运动会广播稿大全
2014/02/17 职场文书
学生个人自我鉴定
2014/03/26 职场文书
高中教师个人总结
2015/02/10 职场文书
首次购房证明
2015/06/19 职场文书
卖车协议书范文
2016/03/23 职场文书
Python+OpenCV实现图片中的圆形检测
2022/04/07 Python