python获取整个网页源码的方法


Posted in Python onAugust 03, 2020

1、Python中获取整个页面的代码:

import requests
res = requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding = 'utf-8'
print(res.text)

2、运行结果

python获取整个网页源码的方法

实例扩展:

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,
   print links,
   print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

到此这篇关于python获取整个网页源码的方法的文章就介绍到这了,更多相关python如何获取整个页面内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
跟老齐学Python之类的细节
Oct 13 Python
Python入门篇之面向对象
Oct 20 Python
更改Python命令行交互提示符的方法
Jan 14 Python
Python科学计算之Pandas详解
Jan 15 Python
Python中模块pymysql查询结果后如何获取字段列表
Jun 05 Python
python实现跨excel的工作表sheet之间的复制方法
May 03 Python
django框架自定义模板标签(template tag)操作示例
Jun 24 Python
Django的models中on_delete参数详解
Jul 16 Python
django基于cors解决跨域请求问题详解
Aug 06 Python
python中的subprocess.Popen()使用详解
Dec 25 Python
flask 框架操作MySQL数据库简单示例
Feb 02 Python
Django单元测试中Fixtures用法详解
Feb 25 Python
flask开启多线程的具体方法
Aug 02 #Python
基于opencv实现简单画板功能
Aug 02 #Python
django下创建多个app并设置urls方法
Aug 02 #Python
Django如何在不停机的情况下创建索引
Aug 02 #Python
如何用Anaconda搭建虚拟环境并创建Django项目
Aug 02 #Python
如何解决flask修改静态资源后缓存文件不能及时更改问题
Aug 02 #Python
Flask缓存静态文件的具体方法
Aug 02 #Python
You might like
关于PHP开发的9条建议
2015/07/27 PHP
php 替换文章中的图片路径,下载图片到本地服务器的方法
2018/02/06 PHP
收集的10个免费的jQuery相册
2011/02/26 Javascript
用JS做的简单的可折叠的两级树形菜单
2013/09/21 Javascript
使用node.js半年来总结的 10 条经验
2014/08/18 Javascript
angularjs的一些优化小技巧
2014/12/06 Javascript
深入分析JSONP跨域的原理
2014/12/10 Javascript
easyui Droppable组件实现放置特效
2015/08/19 Javascript
javascript实现tab响应式切换特效
2016/01/29 Javascript
javascript移动开发中touch触摸事件详解
2016/03/18 Javascript
jQuery解决浏览器兼容性问题案例分析
2016/04/15 Javascript
全面理解JavaScript中的继承(必看)
2016/06/16 Javascript
AngularJS中指令的四种基本形式实例分析
2016/11/22 Javascript
javascript实现下雨效果
2017/03/27 Javascript
JavaScript Date对象应用实例分享
2017/10/30 Javascript
bootstrap实现点击删除按钮弹出确认框的实例代码
2018/08/16 Javascript
JS实现的点击按钮图片上下滚动效果示例
2019/01/28 Javascript
layui清除radio的选中状态实例
2019/11/14 Javascript
vue中实现拖动调整左右两侧div的宽度的示例代码
2020/07/22 Javascript
Python三种遍历文件目录的方法实例代码
2018/01/19 Python
对Python中内置异常层次结构详解
2018/10/18 Python
python fuzzywuzzy模块模糊字符串匹配详细用法
2019/08/29 Python
简单了解python协程的相关知识
2019/08/31 Python
解决keras使用cov1D函数的输入问题
2020/06/29 Python
Selenium结合BeautifulSoup4编写简单的python爬虫
2020/11/06 Python
canvas绘制视频封面的方法
2018/02/05 HTML / CSS
台湾时尚彩瞳专门店:imeime
2019/08/16 全球购物
几道PHP的面试题
2012/05/19 面试题
生物专业个人自荐信范文
2013/11/29 职场文书
校园歌手大赛策划书
2014/01/17 职场文书
社区安全检查制度
2014/02/03 职场文书
销售顾问岗位职责
2014/02/25 职场文书
青年文明号创建承诺
2014/03/31 职场文书
相亲活动方案
2014/08/26 职场文书
地道战观后感300字
2015/06/04 职场文书
幼儿园迎新生欢迎词
2015/09/30 职场文书