python访问抓取网页常用命令总结


Posted in Python onApril 11, 2017

python访问抓取网页常用命令

简单的抓取网页:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

直接将URL保存为本地文件:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

POST方式:

import urllib.parse 
import urllib.request 
 
url="http://liuxin-blog.appspot.com/messageboard/add" 
 
values={"content":"命令行发出网页请求测试"} 
data=urllib.parse.urlencode(values) 

#创建请求对象 
req=urllib.request.Request(url,data) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

GET方式:

import urllib.parse 
import urllib.request 
 
url="http://www.google.cn/webhp" 
 
values={"rls":"ig"} 
data=urllib.parse.urlencode(values) 
 
theurl=url+"?"+data 
#创建请求对象 
req=urllib.request.Request(theurl) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

有2个常用的方法,geturl(),info()

geturl()的设置是为了辨别是否有服务器端的网址重定向,而info()则包含了一系列的信息。

中文问题的处理,会用到 encode()编码 dencode()解码:

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
python文件读写并使用mysql批量插入示例分享(python操作mysql)
Feb 17 Python
python实现去除下载电影和电视剧文件名中的多余字符的方法
Sep 23 Python
python写入xml文件的方法
May 08 Python
python通过cookie模拟已登录状态的初步研究
Nov 09 Python
Python下的Softmax回归函数的实现方法(推荐)
Jan 26 Python
python操作MySQL 模拟简单银行转账操作
Sep 27 Python
python如何将图片转换为字符图片
Aug 19 Python
python中的decorator的作用详解
Jul 26 Python
python简单操作excle的方法
Sep 12 Python
PyQt5图形界面播放音乐的实例
Jun 17 Python
Numpy中ndim、shape、dtype、astype的用法详解
Jun 14 Python
解决selenium+Headless Chrome实现不弹出浏览器自动化登录的问题
Jan 09 Python
Python 登录网站详解及实例
Apr 11 #Python
python实现FTP服务器服务的方法
Apr 11 #Python
python读写json文件的简单实现
Apr 11 #Python
Python实现Mysql数据库连接池实例详解
Apr 11 #Python
详解Python中类的定义与使用
Apr 11 #Python
python获取指定时间差的时间实例详解
Apr 11 #Python
一个基于flask的web应用诞生 组织结构调整(7)
Apr 11 #Python
You might like
一台收音机,让一家人都笑逐颜开!
2020/08/21 无线电
php5编程中的异常处理详细方法介绍
2008/07/29 PHP
在Windows下编译适用于PHP 5.2.12及5.2.13的eAccelerator.dll(附下载)
2010/05/04 PHP
destoon整合ucenter后注册页面不跳转的解决方法
2014/06/21 PHP
php实现倒计时效果
2015/12/19 PHP
PHP调用API接口实现天气查询功能的示例
2017/09/21 PHP
CI框架附属类用法分析
2018/12/26 PHP
Laravel框架实现定时Task Scheduling例子
2019/10/22 PHP
JavaScript 继承详解(一)
2009/07/13 Javascript
JQuery动态创建DOM、表单元素的实现代码
2011/08/09 Javascript
解析jQuery与其它js(Prototype)库兼容共存
2013/07/04 Javascript
jquery中load方法的用法及注意事项说明
2014/02/22 Javascript
jquery实现的导航固定效果
2014/04/28 Javascript
基于javascript实现窗口抖动效果
2016/01/03 Javascript
js判断是否为空和typeof的用法(详解)
2016/10/07 Javascript
使用 vue.js 构建大型单页应用
2018/02/10 Javascript
Angular使用过滤器uppercase/lowercase实现字母大小写转换功能示例
2018/03/27 Javascript
详解webpack loader和plugin编写
2018/10/12 Javascript
js如何实现元素曝光上报
2019/08/07 Javascript
ES6基础之数组和对象的拓展实例详解
2019/08/22 Javascript
layui树形菜单动态遍历的例子
2019/09/23 Javascript
vue 出现data-v-xxx的原因及解决
2020/08/04 Javascript
Vue-cli打包后部署到子目录下的路径问题说明
2020/09/02 Javascript
js实现购物车商品数量加减
2020/09/21 Javascript
Python中property属性实例解析
2018/02/10 Python
解决Python中回文数和质数的问题
2019/11/24 Python
python 的topk算法实例
2020/04/02 Python
CSS3的颜色渐变效果的示例代码
2017/09/29 HTML / CSS
个人应聘自我评价分享
2013/11/18 职场文书
内容编辑个人求职信
2013/12/10 职场文书
《我爱祖国》演讲稿1000字
2014/09/26 职场文书
公安民警正风肃纪剖析材料
2014/10/10 职场文书
安全教育主题班会总结
2015/08/14 职场文书
HR在给员工开具离职证明时,需要注意哪些问题?
2019/07/03 职场文书
JS如何使用剪贴板操作Clipboard API
2021/05/17 Javascript
python 单机五子棋对战游戏
2022/04/28 Python