Python爬虫学习之获取指定网页源码


Posted in Python onJuly 30, 2019

本文实例为大家分享了Python获取指定网页源码的具体代码,供大家参考,具体内容如下

1、任务简介

前段时间一直在学习Python基础知识,故未更新博客,近段时间学习了一些关于爬虫的知识,我会分为多篇博客对所学知识进行更新,今天分享的是获取指定网页源码的方法,只有将网页源码抓取下来才能从中提取我们需要的数据。

2、任务代码

Python获取指定网页源码的方法较为简单,我在Java中使用了38行代码才获取了网页源码(大概是学艺不精),而Python中只用了6行就达到了效果。

Python中获取网页源码最简单的方法就是使用urllib包,具体代码如下:

import urllib.request    #导入urllib.request库
b = str(input("请输入:"))  #提示用户输入信息,并强制类型转换为字符串型
a = urllib.request.urlopen(b)#打开指定网址
html = a.read()       #读取网页源码
html = html.decode("utf-8") #解码为unicode码
print(html)         #打印网页源码

我输入的网址是我博客主页的网址https://blog.csdn.net/lsylsy726

运行结果如下:

Python爬虫学习之获取指定网页源码

3、总结

这篇博客介绍的方法较为简单,其实有的网站会“反爬虫”,这时就需要我们使用User-Agent或者代理,这些东西都会在后面的博客中进行更新,我预计在后面博客中更新“读取CSDN博客访问量的小程序”和“有道翻译小程序”及其他更难一些的知识,由于刚开始学习爬虫,水平有限,请大家多多包涵。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python的Django框架中的Context使用
Jul 15 Python
使用Python实现BT种子和磁力链接的相互转换
Nov 09 Python
Python利用operator模块实现对象的多级排序详解
May 09 Python
Python面向对象类的继承实例详解
Jun 27 Python
由面试题加深对Django的认识理解
Jul 19 Python
基于python分析你的上网行为 看看你平时上网都在干嘛
Aug 13 Python
python使用socket 先读取长度,在读取报文内容示例
Sep 26 Python
Pandas 解决dataframe的一列进行向下顺移问题
Dec 27 Python
关于多元线性回归分析——Python&SPSS
Feb 24 Python
基于Python的Jenkins的二次开发操作
May 12 Python
如何在sublime编辑器中安装python
May 20 Python
Python 图片处理库exifread详解
Feb 25 Python
django-初始配置(纯手写)详解
Jul 30 #Python
django 单表操作实例详解
Jul 30 #Python
Apache部署Django项目图文详解
Jul 30 #Python
Python 使用list和tuple+条件判断详解
Jul 30 #Python
用python wxpy管理微信公众号并利用微信获取自己的开源数据
Jul 30 #Python
Python实现二叉搜索树BST的方法示例
Jul 30 #Python
django 基于中间件实现限制ip频繁访问过程详解
Jul 30 #Python
You might like
PHP中for循环语句的几种变型
2006/11/26 PHP
PHP 文件缓存的性能测试
2010/04/25 PHP
PHP常用的缓存技术汇总
2014/05/05 PHP
php实现图片转换成ASCII码的方法
2015/04/03 PHP
YII2框架中excel表格导出的方法详解
2017/07/21 PHP
Laravel5.5 动态切换多语言的操作方式
2019/10/25 PHP
些很实用且必用的小脚本代码
2006/06/26 Javascript
jQuery live
2009/05/15 Javascript
jQuery中调用WebService方法小结
2011/03/28 Javascript
判断数组的最佳方法(推荐)
2016/10/11 Javascript
BootStrap网页中代码显示用法详解
2016/10/21 Javascript
基于jQuery的checkbox全选问题分析
2016/11/18 Javascript
nodejs入门教程三:调用内部和外部方法示例
2017/04/24 NodeJs
vue实现模态框的通用写法推荐
2018/02/26 Javascript
Postman环境变量全局变量使用方法详解
2020/08/13 Javascript
解决ant Design Search无法输入内容的问题
2020/10/29 Javascript
swiper实现导航滚动效果
2020/12/13 Javascript
Python中使用动态变量名的方法
2014/05/06 Python
一个小示例告诉你Python语言的优雅之处
2014/07/04 Python
Python功能键的读取方法
2015/05/28 Python
Python文件及目录操作实例详解
2015/06/04 Python
Python网络爬虫实例讲解
2016/04/28 Python
Python 比较文本相似性的方法(difflib,Levenshtein)
2018/10/15 Python
Python 给某个文件名添加时间戳的方法
2018/10/16 Python
Python 最大概率法进行汉语切分的方法
2018/12/14 Python
python3在同一行内输入n个数并用列表保存的例子
2019/07/20 Python
使用python绘制cdf的多种实现方法
2020/02/25 Python
Pytorch 高效使用GPU的操作
2020/06/27 Python
Python Selenium模块安装使用教程详解
2020/07/09 Python
Python Pivot table透视表使用方法解析
2020/09/11 Python
英国最大的宠物食品和宠物用品网上零售商: Zooplus
2016/08/01 全球购物
英国在线潜水商店:Simply Scuba
2019/03/25 全球购物
英国设计师泳装、沙滩装和比基尼在线精品店:Beach Cafe
2019/08/28 全球购物
护士毕业自我鉴定
2014/02/07 职场文书
音乐研修感悟
2015/11/18 职场文书
MySQL主从搭建(多主一从)的实现思路与步骤
2021/05/13 MySQL