python访问抓取网页常用命令总结


Posted in Python onApril 11, 2017

python访问抓取网页常用命令

简单的抓取网页:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

直接将URL保存为本地文件:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

POST方式:

import urllib.parse 
import urllib.request 
 
url="http://liuxin-blog.appspot.com/messageboard/add" 
 
values={"content":"命令行发出网页请求测试"} 
data=urllib.parse.urlencode(values) 

#创建请求对象 
req=urllib.request.Request(url,data) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

GET方式:

import urllib.parse 
import urllib.request 
 
url="http://www.google.cn/webhp" 
 
values={"rls":"ig"} 
data=urllib.parse.urlencode(values) 
 
theurl=url+"?"+data 
#创建请求对象 
req=urllib.request.Request(theurl) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

有2个常用的方法,geturl(),info()

geturl()的设置是为了辨别是否有服务器端的网址重定向,而info()则包含了一系列的信息。

中文问题的处理,会用到 encode()编码 dencode()解码:

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
重命名批处理python脚本
Apr 05 Python
python列表与元组详解实例
Nov 01 Python
Python的Django框架中的select_related函数对QuerySet 查询的优化
Apr 01 Python
整理Python最基本的操作字典的方法
Apr 24 Python
用Python抢过年的火车票附源码
Dec 07 Python
使用Python的Flask框架来搭建第一个Web应用程序
Jun 04 Python
对python中for、if、while的区别与比较方法
Jun 25 Python
python实现爬取百度图片的方法示例
Jul 06 Python
在VS2017中用C#调用python脚本的实现
Jul 31 Python
Python logging设置和logger解析
Aug 28 Python
如何使用Python破解ZIP或RAR压缩文件密码
Jan 09 Python
Pycharm插件(Grep Console)自定义规则输出颜色日志的方法
May 27 Python
Python 登录网站详解及实例
Apr 11 #Python
python实现FTP服务器服务的方法
Apr 11 #Python
python读写json文件的简单实现
Apr 11 #Python
Python实现Mysql数据库连接池实例详解
Apr 11 #Python
详解Python中类的定义与使用
Apr 11 #Python
python获取指定时间差的时间实例详解
Apr 11 #Python
一个基于flask的web应用诞生 组织结构调整(7)
Apr 11 #Python
You might like
php基础知识:类与对象(1)
2006/12/13 PHP
php+mysql结合Ajax实现点赞功能完整实例
2015/01/30 PHP
php 使用array函数实现分页
2015/02/13 PHP
PHP面向对象自动加载机制原理与用法分析
2016/10/14 PHP
Redis构建分布式锁
2017/03/28 PHP
PHP错误处理函数register_shutdown_function使用示例
2017/07/03 PHP
PHP基于GD库实现的生成图片缩略图函数示例
2017/07/05 PHP
了解了这些才能开始发挥jQuery的威力
2013/10/10 Javascript
解决jquery无法找到其他父级子集问题的方法
2016/05/10 Javascript
打造自己的jQuery插件入门教程
2016/09/23 Javascript
vue2.X组件学习心得(新手必看篇)
2017/07/05 Javascript
Vue前后端不同端口的实现方法
2018/09/19 Javascript
Angular7中创建组件/自定义指令/管道的方法实例详解
2019/04/02 Javascript
vue-cli设置publicPath小记
2020/04/14 Javascript
JavaScript 函数用法详解【函数定义、参数、绑定、作用域、闭包等】
2020/05/12 Javascript
vue实现购物车加减
2020/05/30 Javascript
[35:27]完美世界DOTA2联赛循环赛 GXR vs FTD BO2第二场 10.29
2020/10/29 DOTA
Python实现提取谷歌音乐搜索结果的方法
2015/07/10 Python
Eclipse中Python开发环境搭建简单教程
2016/03/23 Python
运用TensorFlow进行简单实现线性回归、梯度下降示例
2018/03/05 Python
超简单使用Python换脸实例
2019/03/27 Python
详解PyCharm+QTDesigner+PyUIC使用教程
2019/06/13 Python
python 寻找离散序列极值点的方法
2019/07/10 Python
django项目简单调取百度翻译接口的方法
2019/08/06 Python
Python学习笔记之错误和异常及访问错误消息详解
2019/08/08 Python
python基本算法之实现归并排序(Merge sort)
2020/09/01 Python
化学教学随笔感言
2014/02/19 职场文书
2014社区三八妇女节活动总结
2014/03/01 职场文书
参观接待方案
2014/03/17 职场文书
国际贸易系求职信
2014/08/09 职场文书
2014大学校园光棍节活动策划书
2014/09/29 职场文书
2015廉洁自律个人总结
2015/02/14 职场文书
以权谋私检举信范文
2015/03/02 职场文书
python pygame入门教程
2021/06/01 Python
nginx服务器的下载安装与使用详解
2021/08/02 Servers
微信小程序 根据不同用户切换不同TabBar
2022/04/21 Javascript