Python爬虫学习之获取指定网页源码


Posted in Python onJuly 30, 2019

本文实例为大家分享了Python获取指定网页源码的具体代码,供大家参考,具体内容如下

1、任务简介

前段时间一直在学习Python基础知识,故未更新博客,近段时间学习了一些关于爬虫的知识,我会分为多篇博客对所学知识进行更新,今天分享的是获取指定网页源码的方法,只有将网页源码抓取下来才能从中提取我们需要的数据。

2、任务代码

Python获取指定网页源码的方法较为简单,我在Java中使用了38行代码才获取了网页源码(大概是学艺不精),而Python中只用了6行就达到了效果。

Python中获取网页源码最简单的方法就是使用urllib包,具体代码如下:

import urllib.request    #导入urllib.request库
b = str(input("请输入:"))  #提示用户输入信息,并强制类型转换为字符串型
a = urllib.request.urlopen(b)#打开指定网址
html = a.read()       #读取网页源码
html = html.decode("utf-8") #解码为unicode码
print(html)         #打印网页源码

我输入的网址是我博客主页的网址https://blog.csdn.net/lsylsy726

运行结果如下:

Python爬虫学习之获取指定网页源码

3、总结

这篇博客介绍的方法较为简单,其实有的网站会“反爬虫”,这时就需要我们使用User-Agent或者代理,这些东西都会在后面的博客中进行更新,我预计在后面博客中更新“读取CSDN博客访问量的小程序”和“有道翻译小程序”及其他更难一些的知识,由于刚开始学习爬虫,水平有限,请大家多多包涵。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 冒泡,选择,插入排序使用实例
Feb 05 Python
在Python中操作列表之List.append()方法的使用
May 20 Python
python更新列表的方法
Jul 28 Python
利用python解决mysql视图导入导出依赖的问题
Dec 17 Python
Python之web模板应用
Dec 26 Python
学习和使用python的13个理由
Jul 30 Python
flask框架自定义过滤器示例【markdown文件读取和展示功能】
Nov 08 Python
Python如何基于rsa模块实现非对称加密与解密
Jan 03 Python
Python字典深浅拷贝与循环方式方法详解
Feb 09 Python
python GUI库图形界面开发之PyQt5信号与槽事件处理机制详细介绍与实例解析
Mar 08 Python
matplotlib运行时配置(Runtime Configuration,rc)参数rcParams解析
Jan 05 Python
python 自动刷新网页的两种方法
Apr 20 Python
django-初始配置(纯手写)详解
Jul 30 #Python
django 单表操作实例详解
Jul 30 #Python
Apache部署Django项目图文详解
Jul 30 #Python
Python 使用list和tuple+条件判断详解
Jul 30 #Python
用python wxpy管理微信公众号并利用微信获取自己的开源数据
Jul 30 #Python
Python实现二叉搜索树BST的方法示例
Jul 30 #Python
django 基于中间件实现限制ip频繁访问过程详解
Jul 30 #Python
You might like
php xfocus防注入资料
2008/04/27 PHP
限制复选框的最大可选数
2006/07/01 Javascript
jQuery EasyUI API 中文文档 - ComboBox组合框
2011/10/07 Javascript
jQuery 获取URL的GET参数值的小例子
2013/04/18 Javascript
window.location.reload 刷新使用分析(去对话框)
2015/11/11 Javascript
jQuery Validate表单验证入门学习
2015/12/18 Javascript
js控件Kindeditor实现图片自动上传功能
2020/07/20 Javascript
JavaScript计算器网页版实现代码分享
2016/07/15 Javascript
教你JS中的运算符乘方、开方及变量格式转换
2016/08/09 Javascript
vue2.0+koa2+mongodb实现注册登录
2018/04/10 Javascript
jQuery实现模糊搜索功能的方法分析
2018/06/29 jQuery
微信小程序第三方框架对比 之 wepy / mpvue / taro
2019/04/10 Javascript
javascript实现动态时钟的启动和停止
2020/07/29 Javascript
vue实现购物车选择功能
2020/01/10 Javascript
Python 流程控制实例代码
2009/09/25 Python
Python的装饰器模式与面向切面编程详解
2015/06/21 Python
Python进阶-函数默认参数(详解)
2017/05/18 Python
浅谈Python NLP入门教程
2017/12/25 Python
Python 使用with上下文实现计时功能
2018/03/09 Python
基于python二叉树的构造和打印例子
2019/08/09 Python
Python3.6实现根据电影名称(支持电视剧名称),获取下载链接的方法
2019/08/26 Python
python目标检测给图画框,bbox画到图上并保存案例
2020/03/10 Python
浅谈Selenium+Webdriver 常用的元素定位方式
2021/01/13 Python
英国游戏机和游戏购物网站:365games.co.uk
2018/06/18 全球购物
澳大利亚办公室装修:JasonL Office Furniture
2019/06/25 全球购物
英语专业毕业生自我鉴定
2013/11/09 职场文书
小学岗位竞聘方案
2014/01/22 职场文书
财产保全担保书范文
2014/04/01 职场文书
计算机专业自荐信范文
2014/05/28 职场文书
商业项目策划方案
2014/06/05 职场文书
国际残疾人日广播稿范文
2014/10/09 职场文书
陈斌强事迹观后感
2015/06/17 职场文书
孙振耀退休感言
2015/08/01 职场文书
2019个人工作总结
2019/06/21 职场文书
Spring boot应用启动后首次访问很慢的解决方案
2021/06/23 Java/Android
利用JavaScript写一个简单计算器
2021/11/27 Javascript