python访问抓取网页常用命令总结


Posted in Python onApril 11, 2017

python访问抓取网页常用命令

简单的抓取网页:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

直接将URL保存为本地文件:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

POST方式:

import urllib.parse 
import urllib.request 
 
url="http://liuxin-blog.appspot.com/messageboard/add" 
 
values={"content":"命令行发出网页请求测试"} 
data=urllib.parse.urlencode(values) 

#创建请求对象 
req=urllib.request.Request(url,data) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

GET方式:

import urllib.parse 
import urllib.request 
 
url="http://www.google.cn/webhp" 
 
values={"rls":"ig"} 
data=urllib.parse.urlencode(values) 
 
theurl=url+"?"+data 
#创建请求对象 
req=urllib.request.Request(theurl) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

有2个常用的方法,geturl(),info()

geturl()的设置是为了辨别是否有服务器端的网址重定向,而info()则包含了一系列的信息。

中文问题的处理,会用到 encode()编码 dencode()解码:

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
python获得linux下所有挂载点(mount points)的方法
Apr 29 Python
Python实现Mysql数据库连接池实例详解
Apr 11 Python
Flask web开发处理POST请求实现(登录案例)
Jul 26 Python
python2.7使用plotly绘制本地散点图和折线图
Apr 02 Python
Python安装Flask环境及简单应用示例
May 03 Python
超实用的 30 段 Python 案例
Oct 10 Python
Win10下python 2.7与python 3.7双环境安装教程图解
Oct 12 Python
Python变量作用域LEGB用法解析
Feb 04 Python
python GUI库图形界面开发之PyQt5切换按钮控件QPushButton详细使用方法与实例
Feb 28 Python
Python yield的用法实例分析
Mar 06 Python
python中for in的用法详解
Apr 17 Python
python小白学习包管理器pip安装
Jun 09 Python
Python 登录网站详解及实例
Apr 11 #Python
python实现FTP服务器服务的方法
Apr 11 #Python
python读写json文件的简单实现
Apr 11 #Python
Python实现Mysql数据库连接池实例详解
Apr 11 #Python
详解Python中类的定义与使用
Apr 11 #Python
python获取指定时间差的时间实例详解
Apr 11 #Python
一个基于flask的web应用诞生 组织结构调整(7)
Apr 11 #Python
You might like
thinkphp修改配置进入默认首页的方法
2017/02/07 PHP
Laravel 的数据库迁移的方法
2017/07/31 PHP
yii2.0框架使用 beforeAction 防非法登陆的方法分析
2019/09/11 PHP
解决php写入数据库乱码的问题
2019/09/17 PHP
在chrome中window.onload事件的一些问题
2010/03/01 Javascript
jquery parent和parents的区别分析
2013/10/02 Javascript
jQuery 监控键盘一段时间没输入
2016/04/22 Javascript
JavaScript 深层克隆对象详解及实例
2016/11/03 Javascript
实例分析nodejs模块xml2js解析xml过程中遇到的坑
2017/03/18 NodeJs
在小程序中集成redux/immutable/thunk第三方库的方法
2018/08/12 Javascript
element-ui表格数据转换的示例代码
2018/08/24 Javascript
解决vue select当前value没有更新到vue对象属性的问题
2018/08/30 Javascript
微信小程序实现图片上传
2019/05/23 Javascript
layui实现数据表格点击搜索功能
2020/03/26 Javascript
JavaScript字符串处理常见操作方法小结
2019/11/15 Javascript
vue excel上传预览和table内容下载到excel文件中
2019/12/10 Javascript
JS检索下拉列表框中被选项目的索引号(selectedIndex)
2019/12/17 Javascript
[15:20]DOTA2亚洲邀请赛总决赛开幕式表演:羽泉献唱
2017/04/05 DOTA
Python语言的面相对象编程方式初步学习
2016/03/12 Python
Python基于二分查找实现求整数平方根的方法
2016/05/12 Python
浅析python中的分片与截断序列
2016/08/09 Python
关于Pytorch的MLP模块实现方式
2020/01/07 Python
在 Python 中接管键盘中断信号的实现方法
2020/02/04 Python
tensorflow实现训练变量checkpoint的保存与读取
2020/02/10 Python
解决numpy矩阵相减出现的负值自动转正值的问题
2020/06/03 Python
如何解决flask修改静态资源后缓存文件不能及时更改问题
2020/08/02 Python
关于前端上传文件全面基础扫盲贴(入门)
2019/08/01 HTML / CSS
Stutterheim瑞典:瑞典高级外套时装品牌
2019/06/24 全球购物
laravel使用redis队列实例讲解
2021/03/23 PHP
医药专业应届毕业生求职信范文
2014/01/01 职场文书
师生聚会感言
2014/01/26 职场文书
消防先进事迹材料
2014/02/10 职场文书
水污染治理工程专业自荐信
2014/06/21 职场文书
2014年青年志愿者工作总结
2014/12/09 职场文书
学习《中小学教师职业道德规范》心得体会
2016/01/18 职场文书
MySQL派生表联表查询实战过程
2022/03/20 MySQL