编程 Python

python访问抓取网页常用命令总结

Posted in Python onApril 11, 2017

python访问抓取网页常用命令

简单的抓取网页:

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

直接将URL保存为本地文件：

import urllib.request  
url="http://google.cn/" 
response=urllib.request.urlopen(url)  #返回文件对象
page=response.read()

POST方式：

import urllib.parse 
import urllib.request 
 
url="http://liuxin-blog.appspot.com/messageboard/add" 
 
values={"content":"命令行发出网页请求测试"} 
data=urllib.parse.urlencode(values) 

#创建请求对象 
req=urllib.request.Request(url,data) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

GET方式：

import urllib.parse 
import urllib.request 
 
url="http://www.google.cn/webhp" 
 
values={"rls":"ig"} 
data=urllib.parse.urlencode(values) 
 
theurl=url+"?"+data 
#创建请求对象 
req=urllib.request.Request(theurl) 
#获得服务器返回的数据 
response=urllib.request.urlopen(req) 
#处理数据 
page=response.read()

有2个常用的方法,geturl(),info()

geturl()的设置是为了辨别是否有服务器端的网址重定向,而info()则包含了一系列的信息。

中文问题的处理，会用到 encode()编码 dencode()解码：

感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

python访问抓取网页常用命令总结

- Author -

lqh

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python文件读写并使用mysql批量插入示例分享(python操作mysql)

Feb 17 Python

python实现去除下载电影和电视剧文件名中的多余字符的方法

Sep 23 Python

python写入xml文件的方法

May 08 Python

python通过cookie模拟已登录状态的初步研究

Nov 09 Python

Python下的Softmax回归函数的实现方法(推荐)

Jan 26 Python

python操作MySQL 模拟简单银行转账操作

Sep 27 Python

python如何将图片转换为字符图片

Aug 19 Python

python中的decorator的作用详解

Jul 26 Python

python简单操作excle的方法

Sep 12 Python

PyQt5图形界面播放音乐的实例

Jun 17 Python

Numpy中ndim、shape、dtype、astype的用法详解

Jun 14 Python

解决selenium+Headless Chrome实现不弹出浏览器自动化登录的问题

Jan 09 Python

Python 登录网站详解及实例

Apr 11 #Python

python实现FTP服务器服务的方法

Apr 11 #Python

python读写json文件的简单实现

Apr 11 #Python

Python实现Mysql数据库连接池实例详解

Apr 11 #Python

详解Python中类的定义与使用

Apr 11 #Python

python获取指定时间差的时间实例详解

Apr 11 #Python

一个基于flask的web应用诞生组织结构调整（7）

Apr 11 #Python

You might like

一台收音机，让一家人都笑逐颜开！

2020/08/21 无线电

php5编程中的异常处理详细方法介绍

2008/07/29 PHP

在Windows下编译适用于PHP 5.2.12及5.2.13的eAccelerator.dll(附下载)

2010/05/04 PHP

destoon整合ucenter后注册页面不跳转的解决方法

2014/06/21 PHP

php实现倒计时效果

2015/12/19 PHP

PHP调用API接口实现天气查询功能的示例

2017/09/21 PHP

CI框架附属类用法分析

2018/12/26 PHP

Laravel框架实现定时Task Scheduling例子

2019/10/22 PHP

JavaScript 继承详解（一）

2009/07/13 Javascript

JQuery动态创建DOM、表单元素的实现代码

2011/08/09 Javascript

解析jQuery与其它js(Prototype)库兼容共存

2013/07/04 Javascript

jquery中load方法的用法及注意事项说明

2014/02/22 Javascript

jquery实现的导航固定效果

2014/04/28 Javascript

基于javascript实现窗口抖动效果

2016/01/03 Javascript

js判断是否为空和typeof的用法(详解)

2016/10/07 Javascript

使用 vue.js 构建大型单页应用

2018/02/10 Javascript

Angular使用过滤器uppercase/lowercase实现字母大小写转换功能示例

2018/03/27 Javascript

详解webpack loader和plugin编写

2018/10/12 Javascript

js如何实现元素曝光上报

2019/08/07 Javascript

ES6基础之数组和对象的拓展实例详解

2019/08/22 Javascript

layui树形菜单动态遍历的例子

2019/09/23 Javascript

vue 出现data-v-xxx的原因及解决

2020/08/04 Javascript

Vue-cli打包后部署到子目录下的路径问题说明

2020/09/02 Javascript

js实现购物车商品数量加减

2020/09/21 Javascript

Python中property属性实例解析

2018/02/10 Python

解决Python中回文数和质数的问题

2019/11/24 Python

python 的topk算法实例

2020/04/02 Python

CSS3的颜色渐变效果的示例代码

2017/09/29 HTML / CSS

个人应聘自我评价分享

2013/11/18 职场文书

内容编辑个人求职信

2013/12/10 职场文书

《我爱祖国》演讲稿1000字

2014/09/26 职场文书

公安民警正风肃纪剖析材料

2014/10/10 职场文书

安全教育主题班会总结

2015/08/14 职场文书

HR在给员工开具离职证明时，需要注意哪些问题？

2019/07/03 职场文书

JS如何使用剪贴板操作Clipboard API

2021/05/17 Javascript

python 单机五子棋对战游戏

2022/04/28 Python