python访问抓取网页常用命令总结


Posted in Python onApril 11, 2017

python访问抓取网页常用命令

简单的抓取网页:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

直接将URL保存为本地文件:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

POST方式:

import urllib.parse 
import urllib.request 
 
url="http://liuxin-blog.appspot.com/messageboard/add" 
 
values={"content":"命令行发出网页请求测试"} 
data=urllib.parse.urlencode(values) 

#创建请求对象 
req=urllib.request.Request(url,data) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

GET方式:

import urllib.parse 
import urllib.request 
 
url="http://www.google.cn/webhp" 
 
values={"rls":"ig"} 
data=urllib.parse.urlencode(values) 
 
theurl=url+"?"+data 
#创建请求对象 
req=urllib.request.Request(theurl) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

有2个常用的方法,geturl(),info()

geturl()的设置是为了辨别是否有服务器端的网址重定向,而info()则包含了一系列的信息。

中文问题的处理,会用到 encode()编码 dencode()解码:

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python BeautifulSoup中文乱码问题的2种解决方法
Apr 22 Python
基于scrapy实现的简单蜘蛛采集程序
Apr 17 Python
python使用装饰器和线程限制函数执行时间的方法
Apr 18 Python
Python设计足球联赛赛程表程序的思路与简单实现示例
Jun 28 Python
如何将python中的List转化成dictionary
Aug 15 Python
tensorflow实现对图片的读取的示例代码
Feb 12 Python
Python编程中NotImplementedError的使用方法
Apr 21 Python
python添加菜单图文讲解
Jun 04 Python
Python利用PyExecJS库执行JS函数的案例分析
Dec 18 Python
Python变量作用域LEGB用法解析
Feb 04 Python
Python计算矩阵的和积的实例详解
Sep 10 Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 Python
Python 登录网站详解及实例
Apr 11 #Python
python实现FTP服务器服务的方法
Apr 11 #Python
python读写json文件的简单实现
Apr 11 #Python
Python实现Mysql数据库连接池实例详解
Apr 11 #Python
详解Python中类的定义与使用
Apr 11 #Python
python获取指定时间差的时间实例详解
Apr 11 #Python
一个基于flask的web应用诞生 组织结构调整(7)
Apr 11 #Python
You might like
Snoopy类使用小例子
2008/04/15 PHP
PHP rsa加密解密使用方法
2015/04/27 PHP
PHP整合PayPal支付
2015/06/11 PHP
php基于openssl的rsa加密解密示例
2016/07/11 PHP
PHP实现基于图的深度优先遍历输出1,2,3...n的全排列功能
2017/11/10 PHP
JS和jquery获取各种屏幕的宽度和高度的代码
2013/08/02 Javascript
JS+flash实现chrome和ie浏览器下同时可以复制粘贴
2013/09/22 Javascript
Javascript对象属性方法汇总
2013/11/21 Javascript
Node.js中使用事件发射器模式实现事件绑定详解
2014/08/15 Javascript
JS实现网页表格自动变大缩小的方法
2015/03/09 Javascript
JS实现仿新浪微博发布内容为空时提示功能代码
2015/08/19 Javascript
重新理解JavaScript的六种继承方式
2017/03/24 Javascript
node.js中实现kindEditor图片上传功能的方法教程
2017/04/26 Javascript
vue-infinite-loading2.0 中文文档详解
2018/04/08 Javascript
微信小程序中this.data与this.setData的区别详解
2018/09/17 Javascript
vue给组件传递不同的值方法
2018/09/29 Javascript
基于vue实现移动端圆形旋钮插件效果
2018/11/28 Javascript
微信小程序自定义可滑动日历界面
2018/12/28 Javascript
微信小程序实现炫酷的弹出式菜单特效
2019/01/28 Javascript
Vue移动端用淘宝弹性布局lib-flexible插件做适配的方法
2020/05/26 Javascript
详解Vue中的自定义指令
2020/12/07 Vue.js
python将图片文件转换成base64编码的方法
2015/03/14 Python
Python实现的手机号归属地相关信息查询功能示例
2017/06/08 Python
python实现淘宝秒杀聚划算抢购自动提醒源码
2020/06/23 Python
基于Python 装饰器装饰类中的方法实例
2018/04/21 Python
numpy.array 操作使用简单总结
2019/11/08 Python
python3 xpath和requests应用详解
2020/03/06 Python
Python常用数据分析模块原理解析
2020/07/20 Python
利用CSS3参考手册和CSS3代码生成工具加速来学习网页制
2012/07/11 HTML / CSS
使用canvas来完成线性渐变和径向渐变的功能的方法示例
2019/07/25 HTML / CSS
药剂学专业应届生自荐信
2013/09/29 职场文书
考博自荐信
2013/10/25 职场文书
冬季安全检查方案
2014/05/23 职场文书
Pytorch数据读取之Dataset和DataLoader知识总结
2021/05/23 Python
漫画「你在春天醒来」第10卷封面公开
2022/03/21 日漫
SQL Server中搜索特定的对象
2022/05/25 SQL Server