python获取整个网页源码的方法


Posted in Python onAugust 03, 2020

1、Python中获取整个页面的代码:

import requests
res = requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding = 'utf-8'
print(res.text)

2、运行结果

python获取整个网页源码的方法

实例扩展:

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,
   print links,
   print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

到此这篇关于python获取整个网页源码的方法的文章就介绍到这了,更多相关python如何获取整个页面内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python os模块中的isfile()和isdir()函数均返回false问题解决方法
Feb 04 Python
python并发编程之多进程、多线程、异步和协程详解
Oct 28 Python
Python 内置函数memoryview(obj)的具体用法
Nov 23 Python
python list元素为tuple时的排序方法
Apr 18 Python
python获取时间及时间格式转换问题实例代码详解
Dec 06 Python
详解python中递归函数
Apr 16 Python
Python 调用 Outlook 发送邮件过程解析
Aug 08 Python
python 实现兔子生兔子示例
Nov 21 Python
python正则过滤字母、中文、数字及特殊字符方法详解
Feb 11 Python
Python count函数使用方法实例解析
Mar 23 Python
django模板获取list中指定索引的值方式
May 14 Python
利用python绘制中国地图(含省界、河流等)
Sep 21 Python
flask开启多线程的具体方法
Aug 02 #Python
基于opencv实现简单画板功能
Aug 02 #Python
django下创建多个app并设置urls方法
Aug 02 #Python
Django如何在不停机的情况下创建索引
Aug 02 #Python
如何用Anaconda搭建虚拟环境并创建Django项目
Aug 02 #Python
如何解决flask修改静态资源后缓存文件不能及时更改问题
Aug 02 #Python
Flask缓存静态文件的具体方法
Aug 02 #Python
You might like
第十一节 重载 [11]
2006/10/09 PHP
聊天室php&mysql(一)
2006/10/09 PHP
PHP英文字母大小写转换函数小结
2014/05/03 PHP
从wamp到xampp的升级之路
2015/04/08 PHP
PHP二维关联数组的遍历方式(实例讲解)
2017/10/18 PHP
PHP日期和时间函数的使用示例详解
2020/08/06 PHP
延时重复执行函数 lLoopRun.js
2007/05/08 Javascript
EasyUI的treegrid组件动态加载数据问题的解决办法
2011/12/11 Javascript
浅析document.createDocumentFragment()与js效率
2013/07/08 Javascript
现代 JavaScript 开发编程风格Idiomatic.js指南中文版
2014/05/28 Javascript
基于jquery实现等比缩放图片
2014/12/03 Javascript
JS自定义对象实现Java中Map对象功能的方法
2015/01/20 Javascript
js判断鼠标左、中、右键哪个被点击的方法
2015/01/27 Javascript
超实用的javascript时间处理总结
2016/08/16 Javascript
javascript表达式和运算符详解
2017/02/07 Javascript
基于滚动条位置判断的简单实例
2017/12/14 Javascript
为什么要使用Vuex的介绍
2019/01/19 Javascript
JavaScript修改注册表实例代码
2020/01/05 Javascript
Ant-design-vue Table组件customRow属性的使用说明
2020/10/28 Javascript
[00:59]DOTA2英雄背景故事——上古巨神
2020/06/28 DOTA
浅析Python中将单词首字母大写的capitalize()方法
2015/05/18 Python
python安装教程
2018/02/28 Python
python向已存在的excel中新增表,不覆盖原数据的实例
2018/05/02 Python
如何安装并在pycharm使用selenium的方法
2020/04/30 Python
DKNY品牌官网:纽约大都会时尚风格
2016/10/20 全球购物
澳大利亚领先的美容护肤品零售商之一:SkincareStore
2018/01/22 全球购物
俄罗斯运动鞋商店:Sneakerhead
2018/05/10 全球购物
自荐书范文范例
2014/02/13 职场文书
《猴子种树》教学反思
2014/02/14 职场文书
学校后勤岗位职责
2014/02/19 职场文书
卫校毕业生个人自我鉴定
2014/04/28 职场文书
学校教师读书活动总结
2014/07/08 职场文书
python爬虫之爬取笔趣阁小说
2021/04/22 Python
Oracle创建只读账号的详细步骤
2021/06/07 Oracle
python opencv将多个图放在一个窗口的实例详解
2022/02/28 Python
opencv深入浅出了解机器学习和深度学习
2022/03/17 Python