python访问抓取网页常用命令总结


Posted in Python onApril 11, 2017

python访问抓取网页常用命令

简单的抓取网页:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

直接将URL保存为本地文件:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

POST方式:

import urllib.parse 
import urllib.request 
 
url="http://liuxin-blog.appspot.com/messageboard/add" 
 
values={"content":"命令行发出网页请求测试"} 
data=urllib.parse.urlencode(values) 

#创建请求对象 
req=urllib.request.Request(url,data) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

GET方式:

import urllib.parse 
import urllib.request 
 
url="http://www.google.cn/webhp" 
 
values={"rls":"ig"} 
data=urllib.parse.urlencode(values) 
 
theurl=url+"?"+data 
#创建请求对象 
req=urllib.request.Request(theurl) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

有2个常用的方法,geturl(),info()

geturl()的设置是为了辨别是否有服务器端的网址重定向,而info()则包含了一系列的信息。

中文问题的处理,会用到 encode()编码 dencode()解码:

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python操作列表的常用方法分享
Feb 13 Python
使用C语言来扩展Python程序和Zope服务器的教程
Apr 14 Python
Python reduce()函数的用法小结
Nov 15 Python
Python的SimpleHTTPServer模块用处及使用方法简介
Jan 22 Python
Python socket实现简单聊天室
Apr 01 Python
利用python对Excel中的特定数据提取并写入新表的方法
Jun 14 Python
Pycharm简单使用教程(入门小结)
Jul 04 Python
浅谈Python 敏感词过滤的实现
Aug 15 Python
jupyter notebook读取/导出文件/图片实例
Apr 16 Python
浅谈django channels 路由误导
May 28 Python
浅谈keras 模型用于预测时的注意事项
Jun 27 Python
python脚本框架webpy的url映射详解
Nov 20 Python
Python 登录网站详解及实例
Apr 11 #Python
python实现FTP服务器服务的方法
Apr 11 #Python
python读写json文件的简单实现
Apr 11 #Python
Python实现Mysql数据库连接池实例详解
Apr 11 #Python
详解Python中类的定义与使用
Apr 11 #Python
python获取指定时间差的时间实例详解
Apr 11 #Python
一个基于flask的web应用诞生 组织结构调整(7)
Apr 11 #Python
You might like
PHP将字符分解为多个字符串的方法
2014/11/22 PHP
javascript中巧用“闭包”实现程序的暂停执行功能
2007/04/04 Javascript
JavaScript加密解密7种方法总结分析
2007/10/07 Javascript
让低版本浏览器支持input的placeholder属性(js方法)
2013/04/03 Javascript
AngularJS入门知识之MVW类框架的编程思想探讨
2014/12/08 Javascript
JS访问SWF的函数用法实例
2015/07/01 Javascript
jQuery使用each方法与for语句遍历数组示例
2016/06/16 Javascript
浅谈angularJS的$watch失效问题的解决方案
2017/08/11 Javascript
浅析vue.js数组的变异方法
2018/06/30 Javascript
vue-cli3+typescript初体验小结
2019/02/28 Javascript
JavaScript箭头函数中的this详解
2019/06/19 Javascript
vue element table中自定义一些input的验证操作
2020/07/18 Javascript
[01:00:10]完美世界DOTA2联赛PWL S2 FTD vs Inki 第二场 11.21
2020/11/24 DOTA
Python中正则表达式的用法实例汇总
2014/08/18 Python
Python打印斐波拉契数列实例
2015/07/07 Python
Python发送form-data请求及拼接form-data内容的方法
2016/03/05 Python
使用Python的Flask框架构建大型Web应用程序的结构示例
2016/06/04 Python
python添加模块搜索路径方法
2017/09/11 Python
Python实现matplotlib显示中文的方法详解
2018/02/06 Python
python按键按住不放持续响应的实例代码
2019/07/17 Python
Django ImageFiled上传照片并显示的方法
2019/07/28 Python
Django分页功能的实现代码详解
2019/07/29 Python
win7下 python3.6 安装opencv 和 opencv-contrib-python解决 cv2.xfeatures2d.SIFT_create() 的问题
2019/10/24 Python
pygame用blit()实现动画效果的示例代码
2020/05/28 Python
Python在线和离线安装第三方库的方法
2020/10/31 Python
新西兰床上用品和家居用品购物网站:Adairs
2018/04/27 全球购物
菲律宾优惠券网站:MetroDeal
2019/04/12 全球购物
洛佩桑酒店官方网站:Lopesan Hotels
2019/04/15 全球购物
The Hut英国:英国领先的豪华在线百货商店
2019/07/26 全球购物
厨师岗位职责
2013/11/12 职场文书
2014年新农村建设工作总结
2014/12/01 职场文书
建筑工地资料员岗位职责
2015/04/13 职场文书
2016新教师岗前培训心得体会
2016/01/08 职场文书
Nginx解决前端访问资源跨域问题的方法详解
2021/03/31 Servers
React-vscode使用jsx语法的问题及解决方法
2021/06/21 Javascript
vue动态绑定style样式
2022/04/20 Vue.js