python访问抓取网页常用命令总结


Posted in Python onApril 11, 2017

python访问抓取网页常用命令

简单的抓取网页:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

直接将URL保存为本地文件:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

POST方式:

import urllib.parse 
import urllib.request 
 
url="http://liuxin-blog.appspot.com/messageboard/add" 
 
values={"content":"命令行发出网页请求测试"} 
data=urllib.parse.urlencode(values) 

#创建请求对象 
req=urllib.request.Request(url,data) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

GET方式:

import urllib.parse 
import urllib.request 
 
url="http://www.google.cn/webhp" 
 
values={"rls":"ig"} 
data=urllib.parse.urlencode(values) 
 
theurl=url+"?"+data 
#创建请求对象 
req=urllib.request.Request(theurl) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

有2个常用的方法,geturl(),info()

geturl()的设置是为了辨别是否有服务器端的网址重定向,而info()则包含了一系列的信息。

中文问题的处理,会用到 encode()编码 dencode()解码:

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python中类的继承代码实例
Oct 28 Python
python 3.0 模拟用户登录功能并实现三次错误锁定
Nov 01 Python
python 从csv读数据到mysql的实例
Jun 21 Python
python 不同方式读取文件速度不同的实例
Nov 09 Python
python实现桌面壁纸切换功能
Jan 21 Python
python实现全盘扫描搜索功能的方法
Feb 14 Python
Django框架中间件(Middleware)用法实例分析
May 24 Python
Python3.7基于hashlib和Crypto实现加签验签功能(实例代码)
Dec 04 Python
快速解决jupyter notebook启动需要密码的问题
Apr 21 Python
PyTorch安装与基本使用详解
Aug 31 Python
Python+unittest+requests+excel实现接口自动化测试框架
Dec 23 Python
python 制作网站筛选工具(附源码)
Jan 21 Python
Python 登录网站详解及实例
Apr 11 #Python
python实现FTP服务器服务的方法
Apr 11 #Python
python读写json文件的简单实现
Apr 11 #Python
Python实现Mysql数据库连接池实例详解
Apr 11 #Python
详解Python中类的定义与使用
Apr 11 #Python
python获取指定时间差的时间实例详解
Apr 11 #Python
一个基于flask的web应用诞生 组织结构调整(7)
Apr 11 #Python
You might like
php面向对象全攻略 (十四) php5接口技术
2009/09/30 PHP
利用PHP实现短域名互转
2013/07/05 PHP
通过实例解析PHP数据类型转换方法
2020/07/11 PHP
validator验证控件使用代码
2010/11/23 Javascript
js跑步算法的实现代码
2013/12/04 Javascript
探讨JQUERY JSON的反序列化类 using问题的解决方法
2013/12/19 Javascript
了不起的node.js读书笔记之mongodb数据库交互
2014/12/22 Javascript
AngularJS模块管理问题的非常规处理方法
2015/04/29 Javascript
javascript实现点击按钮弹出一个可关闭层窗口同时网页背景变灰的方法
2015/05/13 Javascript
pace.js页面加载进度条插件
2015/09/29 Javascript
React复制到剪贴板的示例代码
2017/08/22 Javascript
vue prop属性传值与传引用示例
2019/11/13 Javascript
JavaScript前端开发时数值运算的小技巧
2020/07/28 Javascript
使用Python抓取模板之家的CSS模板
2015/03/16 Python
Python中IPYTHON入门实例
2015/05/11 Python
python读写json文件的简单实现
2017/04/11 Python
python Opencv将图片转为字符画
2021/02/19 Python
对python中矩阵相加函数sum()的使用详解
2019/01/28 Python
Python分析彩票记录并预测中奖号码过程详解
2019/07/09 Python
TensorFlow实现从txt文件读取数据
2020/02/05 Python
Pytorch中的自动求梯度机制和Variable类实例
2020/02/29 Python
基于pandas向csv添加新的行和列
2020/05/25 Python
如何将anaconda安装配置的mmdetection环境离线拷贝到另一台电脑
2020/10/15 Python
如何使用PHP session
2015/04/21 面试题
洗煤厂厂长岗位职责
2014/01/03 职场文书
商场中秋节广播稿
2014/01/17 职场文书
公司中秋节活动方案
2014/02/12 职场文书
信息技术教学反思
2014/02/12 职场文书
运动会入场词60字
2014/02/15 职场文书
教师节倡议书
2014/08/30 职场文书
幼师个人总结范文
2015/02/28 职场文书
中秋联欢会主持词
2015/07/04 职场文书
经典人生语录分享:不畏将来,不念过去,笑对当下
2019/12/12 职场文书
Redis集群的关闭与重启操作
2021/07/07 Redis
分享mysql的current_timestamp小坑及解决
2021/11/27 MySQL
分享python函数常见关键字
2022/04/26 Python